数据挖掘真的是把人逼到花样百出,我们《生信技能树》作为华语圈生物信息学自媒体界扛把子自然也是被各种开脑洞的思路“骚扰”着,不过大家请不要无限制的怼我的私人微信哈,如果提问,在公众号推文文末留言即可,或者发邮件给我,我的邮箱是 jmzeng1314@163.com
Category Archives: 未分类
10x官网下载pbmc3k数据集走RNA速率分析
突然间发现我们的RNA速率分析笔记仅仅是分享了在Linux操作的部分,见:使用基于python的velocyto软件做RNA速率分析,已经是2021年7月的事情了。 Continue reading
10x官网下载pbmc3k的bam文件走定量流程
最近各个交流群总是看到大家询问一些单细胞公共数据集处理,居然是从bam文件开始,可能是因为都是从ENA数据库下载吧。
https://www.ebi.ac.uk/ena/browser/view/PRJNA578550?show=reads : Continue reading
4个基因如何做go和kegg数据库注释
看到公众号后台有人这样提问:4个基因如何做go和kegg数据库注释!
我觉得这样的问题蛮好玩,说明初学者很容易被各种各样的高大上的数据分析项目给误导,以为go和kegg数据库注释是什么了不得的高级分析,或者说不知道为什么要做,也不知道它可以解决什么问题,仅仅是想搞一下高大上的图表而已。 Continue reading
10x的单细胞转录组fastq文件的R1和R2不能弄混哦
正常走cellranger的定量流程即可,代码我已经是多次分享了。参考:
10x的单细胞ATAC上游流程之cellranger-atac
前面我们组建的《 单细胞多组学上下游全打通 》的微信交流群,提到了该文章的数据集PRJNA768891里面的 atac的10x的单细胞,在ena下载是没有用的,必须去ncbi的sra下载,然后自己转fq文件。见:单细胞数据在ENA数据库和NCBI的SRA是有区别的
docker学习资源合辑
我们这些年一直在《生信技能树》上面分享过部分docker教程, 但是也说不清楚为什么docker一直没有conda那么流行,教程目录如下: Continue reading
CCLE数据库也单细胞信息啦!
文章标题是:《Pan-cancer single-cell RNA-seq identifies recurring programs of cellular heterogeneity》,链接是 https://www.nature.com/articles/s41588-020-00726-6 值得细读! Continue reading
BRCA1基因突变的乳腺癌患者数据哪里找?
乳腺癌研究领域里面BRCA1基因知名度无需方法强调了,毕竟 BRCA1基因的全称就是乳腺癌1号基因,于1990被研究人员确定,它是遗传性乳腺癌有关的基因,所以命名为乳腺癌1号基因,英文简称BRCA1。其实,还有一个姐妹基因BRCA2 ,在1994年被确定。 Continue reading
Bioconductor亚洲线上会议
今天给大家安利一个可以免费报名参加的生物信息线上学术会议:BioC Asia 2021。会议下周就要开始了,先把注册链接放在这里,感兴趣的小伙伴赶紧报名吧:点这里注册参会。 Continue reading
nature文章的差异分析就值得模仿吗?
最近有粉丝提问,他的差异分析跟一篇nature文章的差异分析结果交集少得可怜,不知道自己哪里错误了。 Continue reading
tryCatch的简单实现和复杂实现方式
最近在实习生在处理一个单细胞转录组数据集的时候,发现该研究的全部10x样品里面居然有5个是无法读取的, 所以像我求助。 很有意思。文章是:《Single-cell transcriptomic analysis of the tumor ecosystems underlying initiation and progression of papillary thyroid carcinoma》: Continue reading
在Linux的黑白命令行无法看R语言配色的解决方案
通常情况下我们是在自己的Windows或者Mac电脑使用R语言,出图,每一个步骤都是动态交互并且随时随地的可视化。 Continue reading
SCI文章教你胰腺癌小鼠模型单细胞样品制备
前面我们单细胞天地和联川生物联合分享了单细胞样品制备心得,系列目录如所示: Continue reading
医学教授选择在耄耋之年拿下了物理学博士学位
一口气安装800个R包
我们周末班准备工作主要就是希望大家学会安装R包 http://www.bio-info-trainee.com/3727.html Continue reading
一个**R**NA-seq数据分析的Snakemake流程
RNA-seq数据分析我们分享了很多,有RNA-seq数据分析经验的小伙伴都会觉得很简单,直接把fastq格式的测序数据比对到合适的参考基因组,然后根据匹配的基因组注释文件去定量就可以拿到表达量矩阵。后续就是基于表达量矩阵的差异分析,富集分析! Continue reading
一个基因有两个id我能肿么办
有学员提问, 为什么他看到了一个基因,如下所示,居然有两个id,看起来就非常的诡异,让他百思不得其解。 Continue reading
一大波神经元单细胞亚群相关的标志基因
前些天我们在《生信技能树》公众号的一个教程:这也能画?,我提到了一个很无聊的R包,名字是:scRNAstat ,它可以4行代码进行单细胞转录组的降维聚类分群,其实完全没有技术含量, 就是把 Seurat 流程的一些步骤包装成为了4个函数: Continue reading
药物预测
考虑到很多学员都在咨询如何根据肿瘤样品的表达量矩阵信息,来推测其可能的药物敏感性,所以我们整理了两个R包的用法,以及部分可视化策略。目录如下: Continue reading