24

为什么百分百还原文献结果反而不对呢

去年我在《生信技能树》给学员分享过一个案例:GSE16561 复现,小众的illumina bead芯片,链接在:http://www.bio-info-trainee.com/7483.html ,当时大费周折才拿到跟其数据集原始文献类似的结果,已经是很满意了。最近把这个数据集作为任务安排给最新学徒们,他们反馈给我的结果让我丈二和尚摸不着头脑,居然是百分百还原文献结果,如下所示的差异基因列表Continue reading

22

使用curatedTCGAData下载TCGA数据库信息好用吗

好久没有写TCGA数据库教程了,因为TCGA计划早在2017年就陆陆续续停止了,我那个时候写了几百个教程并且录制了视频。

Continue reading

22

你还缺乳腺癌表达量数据集吗

生存分析你还是在TCGA吗?

最近有粉丝求助说他研究乳腺癌做了单细胞转录组数据,定位到了一个稀有细胞亚群,先看它感兴趣的亚群细胞特异性基因的临床意义,问我有没有除了TCGA数据库之外的其它数据库资源推荐。恰好我做这方面就顺手检索了一下,发现了 curatedBreastData 包,值得推荐!

Continue reading

22

基因集的转录因子富集分析

一般来说,大家拿到了感兴趣的基因集后,通常是做超几何分布检验看看富集到了什么生物学功能数据库,比如KEGG或者GO数据库,或者走gsea/gsva这样的富集分析,也是注释生物学功能数据库。 大家读我的表达芯片的公共数据库挖掘系列推文应该是够多了:

Continue reading

22

真人工智能招聘(微信群答疑)

前段时间,我们分享了: 确实很吸引眼球,也引发了广泛的讨论,见:狼来了!聊个天就能做生信分析的人工智能是否要替代一大波生信人员?
但实际情况是,我们的各个交流群仍然是充斥着“显而易见”的初学者问题,人工智能的出现并不能帮我们减轻工作量。而且我搞出来的群有点太多了,每一个ngs组学教学视频都免费在B站,就同步组建好交流群,见: Continue reading