100篇泛癌研究文献解读目录(长期更新)

Featured

长期更新~~~

为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达) Continue reading

我用rmarkdown写过的教程

Featured

用rmarkdown写教程真心非常方便,尤其是R语言相关的,比如一些R包的应用,或者一些可视化,或者一些统计,下面我简单列出一些我以前写过的,图文并茂,关键是还非常省心,不需要排版,不需要上传图片,整理图片。

一般来说看链接最后的文件名就知道这篇文章讲的是什么了:

Continue reading

一个MeDIP-seq实战-超级简单-2小时搞定!

Featured

请不要直接拷贝我的代码,需要自己理解,然后打出来,思考我为什么这样写代码。
软件请用最新版,尤其是samtools等被我存储在系统环境变量的,考虑到读者众多,一般的软件我都会自带版本信息的!
我用两个小时,不代表你是两个小时就学会,有些朋友反映学了两个星期才 学会,这很正常,没毛病,不要异想天开两个小时就达到我的水平。

MeDIP-seq 跟ChIP-seq的分析手段是一模一样的,同理hMeDIP-seq,caMeDIP-seq等等,都没有本质上的区别,只是用的抗体不一样而已,请自行搜索基础知识,我只讲数据分析。

一个ChIP-seq实战-超级简单-2小时搞定!

一个RNA-seq实战-超级简单-2小时搞定!

Continue reading

11

10X这样的单细胞转录组里面的非编码基因信息很难挖掘

数据挖掘真的是把人逼到花样百出,我们《生信技能树》作为华语圈生物信息学自媒体界扛把子自然也是被各种开脑洞的思路“骚扰”着,不过大家请不要无限制的怼我的私人微信哈,如果提问,在公众号推文文末留言即可,或者发邮件给我,我的邮箱是 jmzeng1314@163.com

最近收到一个有意思的留言,是关于10X这样的单细胞转录组里面的非编码基因的, 目前绝大部分表达量矩阵都是以基因名字为单位,很容易区分成为编码和非编码,我们仍然是以 pbmc3k 这个数据集举例子哈。 Continue reading

11

10x官网下载pbmc3k的bam文件走定量流程

最近各个交流群总是看到大家询问一些单细胞公共数据集处理,居然是从bam文件开始,可能是因为都是从ENA数据库下载吧。

比如文章:《Defining the emergence of myeloid-derived suppressor cells in breast cancer using single-cell transcriptomics》,其数据在 https://www.ebi.ac.uk/ena/browser/view/PRJNA578550?show=readsContinue reading

十二 27

4个基因如何做go和kegg数据库注释

看到公众号后台有人这样提问:4个基因如何做go和kegg数据库注释!

我觉得这样的问题蛮好玩,说明初学者很容易被各种各样的高大上的数据分析项目给误导,以为go和kegg数据库注释是什么了不得的高级分析,或者说不知道为什么要做,也不知道它可以解决什么问题,仅仅是想搞一下高大上的图表而已。 Continue reading

12

10x的单细胞转录组fastq文件的R1和R2不能弄混哦

12

10x的单细胞ATAC上游流程之cellranger-atac

前面我们组建的《 单细胞多组学上下游全打通 》的微信交流群,提到了该文章的数据集PRJNA768891里面的 atac的10x的单细胞,在ena下载是没有用的,必须去ncbi的sra下载,然后自己转fq文件。见:单细胞数据在ENA数据库和NCBI的SRA是有区别的

软件和数据库文件都需要自己在10x的官网简单的注册后免费的下载和安装: Continue reading