Category Archives: 未分类
菜鸟团4万粉丝啦
总编辑海飞前些天告诉我,咱们《生信菜鸟团》公众号订阅人数突破四万大关了。是不是可以搞一下活动,回馈一下粉丝。
不要拿一套垃圾数据入门
做生物信息学也有七八个年头了,早在五六年前,我刚开始写教程的时候,那个时候还是个人博客《生信菜鸟团》就提到过一个观点:给初学者的忠告,不要拿一套垃圾数据入门!原贴见:http://www.bio-info-trainee.com/2321.html
Continue reading
并不一定要单细胞转录组才能看肿瘤免疫微环境个细胞亚群比例
我注意到绝大部分肿瘤相关的单细胞转录组研究的落脚点都是在肿瘤免疫微环境个细胞亚群比例,包括 B细胞,T细胞,巨噬细胞,树突细胞等等,而且这些细胞亚群都是可以继续细分。但实际上在没有单细胞转录组数据这个技术之前,也是可以探测肿瘤免疫微环境个细胞亚群比例的,比如流式细胞仪。但是我查了一下,发现这个仪器还蛮贵的,比如一个招标信息《上海交通大学流式细胞分选仪,200万》:
Continue reading
北大李程老师的基因组学分析课程
早在2018年我们就推荐过北大李程老师的基因组学分析课程,最近看到2019-2020更新后的课程资料也出来了,快马加鞭推荐给大家。
10X的单细胞转录组原始数据也可以在EBI下载
众所周知,测序数据单端测序就是一个fq文件,双端测序就2个。但是呢,10X的单细胞转录组原始数据的话, 比较特殊,它的测序文库中包括index、barcode、UMI和测序reads。
10X单细胞转录组的测序数据量这么少是为什么
最近读到发表在nature medicine杂志的文章《Immune profiling of human tumors identifies CD73 as a combinatorial target in glioblastoma》:
10个细胞系仅1个表达你的基因
遇到了粉丝的一个超级好的问题:
感兴趣的一个基因A,研究它在10种乳腺癌细胞系中的表达情况,跑了western和qpcr 。 发现它只在一种乳腺癌细胞系中表达,其他9种都不表达。 结果是一致的,确认自己的实验没有问题! 现在都怀疑唯一有表达的那个细胞系是不是污染了???
Continue reading
TCGA官方数据挖掘文章教你机器学习
最近我们又组织了:《机器学习加深度学习资料大放送(附上资料群)》交流群,感觉吧,大家松鼠症发作收集整理了大把资料最后却束之高阁,也不是一个事啊。所以就安排学徒系统性讲解一下机器学习的应用。
singleR的7个数据库文件下载失败
singleR是目前单细胞转录组领域算是比较出众的自动化细胞类型注释系统,所以我分享的两个祖传代码里面都加上了它,成为标准流程:
Seurat标准流程之聚类分群(CNS图表复现02)
上个月我们组建了:《单细胞CNS图表复现交流群》,见:你要的rmarkdown文献图表复现全套代码来了(单细胞),也分享了单细胞转录组数据分析的流程:
RNA-seq数据可不只是表达量矩阵结果(CNS图表复现11)
前面我们提到了:表达矩阵是如何得到的(CNS图表复现10),有粉丝提问,既然都开始走RNA-seq数据的上游分析了,到Linux服务器操作了,难道仅仅是为了拿到表达矩阵文件吗?RNA-seq数据分析可以有很多啊,比如融合基因,可变剪切,甚至变异位点。
RNA-seq的3的差异分析R包你选择哪个
在2010-2015年间,RNA-seq本身就是跟现在的单细胞差不多的当红炸子鸡的地位,无数的软件工具,网页数据库,测评文章涌现出来。很多课题组导师都认为做一个RNA-seq项目就能发CNS啦,就跟这两年大家以为做一个单细胞转录组项目就可以发CNS的坚信程度是一模一样的!
R语言确实会蛮耗费磁盘空间哦
我们一直强调大家需要安装在C盘,主要是因为大家都是新手,怕大家各自折腾带来各种各样的稀奇古怪的报错,增加我们教学辅助团队的负担!
R语言奇淫巧技之pdftools包
我们前面讲解过了使用R语言做爬虫,处理图片,写网页应用等等,都在生信基石之R语言,B站的10个小时教学视频!
Continue reading
mskcc的vcf2maf极简解决方案
为了写这个教程,我特意在唐医生的共享云服务器上面测试了,从头到尾运行过,验证过,你一定可以follow成功的哈!
miRNA-seq数据分析其实大同小异
有粉丝咨询,他感兴趣的领域的一篇文章,提供了miRNA-seq数据,但根据我的GEO数据挖掘课程代码,没办法下载到表达量矩阵文件。如下:
Continue reading
inferCNV流程输入数据差异大揭秘(CNS图表复现15)
前面我提到了,我和文章都是取全部的上皮细胞,以及部分Fibroblasts和Endothelial_cells细胞来一起运行inferCNV流程。但是呢,自己的数据里面,是 366 genes and 7044 cells , 得到是CNV数量太少了(第18步写的是:Total CNV’s: 31 )计算量比较小,所以十几分钟就结束了。 Continue reading
inferCNV结果解读及利用之进阶(CNS图表复现17)
前面我们提到的inferCNV结果里面的CNV热图,虽然说可以肉眼简单看看不同的细胞亚群是否具有大面积的CNV事件来判定它是否是恶性细胞,但是这样的判定具有很大程度的主观性,所以理论上需要有更好的方法,也就是计算具体每个细胞的CNV score 。
inferCNV结果解读及利用(CNS图表复现16)
前面我们提到了因为细胞数量比较多,运行infercnv::run的时候,下面两个参数,都是默认值即可:
HMM参数 when set to True, runs HMM to predict CNV level (default: FALSE)
denoise If True, turns on denoising according to options below (default: FALSE)