11

10X这样的单细胞转录组里面的非编码基因信息很难挖掘

数据挖掘真的是把人逼到花样百出,我们《生信技能树》作为华语圈生物信息学自媒体界扛把子自然也是被各种开脑洞的思路“骚扰”着,不过大家请不要无限制的怼我的私人微信哈,如果提问,在公众号推文文末留言即可,或者发邮件给我,我的邮箱是 jmzeng1314@163.com

最近收到一个有意思的留言,是关于10X这样的单细胞转录组里面的非编码基因的, 目前绝大部分表达量矩阵都是以基因名字为单位,很容易区分成为编码和非编码,我们仍然是以 pbmc3k 这个数据集举例子哈。 Continue reading

11

10x官网下载pbmc3k的bam文件走定量流程

最近各个交流群总是看到大家询问一些单细胞公共数据集处理,居然是从bam文件开始,可能是因为都是从ENA数据库下载吧。

比如文章:《Defining the emergence of myeloid-derived suppressor cells in breast cancer using single-cell transcriptomics》,其数据在 https://www.ebi.ac.uk/ena/browser/view/PRJNA578550?show=readsContinue reading

十二 27

4个基因如何做go和kegg数据库注释

看到公众号后台有人这样提问:4个基因如何做go和kegg数据库注释!

我觉得这样的问题蛮好玩,说明初学者很容易被各种各样的高大上的数据分析项目给误导,以为go和kegg数据库注释是什么了不得的高级分析,或者说不知道为什么要做,也不知道它可以解决什么问题,仅仅是想搞一下高大上的图表而已。 Continue reading

12

10x的单细胞转录组fastq文件的R1和R2不能弄混哦

12

10x的单细胞ATAC上游流程之cellranger-atac

前面我们组建的《 单细胞多组学上下游全打通 》的微信交流群,提到了该文章的数据集PRJNA768891里面的 atac的10x的单细胞,在ena下载是没有用的,必须去ncbi的sra下载,然后自己转fq文件。见:单细胞数据在ENA数据库和NCBI的SRA是有区别的

软件和数据库文件都需要自己在10x的官网简单的注册后免费的下载和安装: Continue reading