31

通过IMGT数据库认知免疫组库

免疫组库测序(Immune Repertoire Sequencing,IR-Seq)是非常小众的产品,并不属于TCGA的7种数据(WGS,WES,RNA-seq,miRNA,450K等等),所以我并没有在B站录制公益教学视频。
有趣的是,最近突然接到了一些粉丝求助,关于免疫组库数据处理的。所以就系统性的整理一下相关知识点,并且带领大家实战演练一个完整的免疫组库测序数据项目分析流程哈。 Continue reading

31

生物信息学大百科全书

不知道多久以前在朋友圈看到转发分享:因为疫情,Johns Hopkins的Project Muse 限时免费,包括普林斯顿、康奈尔、乔治亚、哈佛、港中文、ACA、Early Theatre等40多家出版社基本都开放了自己的电子资料库,共有近24000本原版英文书,282本期刊。 链接是:https://about.muse.jhu.edu/resources/freeresourcescovid19/ Continue reading

31

什么,你连10块钱的云服务器都不想买

前些天为了帮助广大粉丝度过难关,所以开放了生信技能树全平台的招聘信息,见:还说啥呢,继续免费啊,而且里面还有一个是:购买入门级服务器免费送Linux直播培训服务,有粉丝留言说之前我们还赠送服务器的,现在居然还要自己购买,这免费活动不诚心啊!我连忙删除了这个留言还把它拉黑! Continue reading

31

谁说肿瘤高表达基因就是生存风险因子

非常多的粉丝在我们生信技能树后台留言询问,为什么他/她关注的基因明明是癌基因,明明是在肿瘤病人高表达(TCGA数据库搜索后的结果),但是却发现它对生存的影响居然是保护因子!(同样的网页工具)

所以我这里安排一个学徒作业,大家需要去下载TCGA数据库的BRCA这个癌症的芯片和RNA-seq的表达矩阵,分别进行差异分析,拿到统计学显著的上下调基因列表。 Continue reading

31

如果你问我R代码调试我就会告诉你head

任何一个编程语言, 要想足够好用,都必须要有完善的代码调试机制,毕竟谁写代码还不碰到几个bug呢。

比如R语言编程,简单的R代码调试,其实靠head,str,help函数即可。所以我从强调初学者应该是要至少把这3个函数敲1000遍以上。比如,群里有人问它的表达矩阵里面的探针ID,跟他准备好的探针ID与基因对应表格, 无法匹配,自己在Excel手动搜索,明明是每一个探针都存在于准备好的探针ID与基因对应表格里面。 Continue reading

30

每个基因都值得研究吗?

最近看到朋友圈都在宣传一个队列研究成果,就是2020年4月30日,ChinaMAP联盟携全国29家研究机构和医院,在中科院上海生命科学研究院主办的Cell Research**杂志发表了长文章“The ChinaMAP analytics of deep whole genome sequences in 10,588 individuals”Continue reading

30

连最基础服务都不让我们专业人士来做了

做知识分享这六年,太多粉丝需要帮助,所以我选择了全部无偿公开我所有技能,不仅仅是R和Linux基础,还包括多种ngs技术数据处理,甚至单细胞,这些教学视频都在B站。这样我就可以轻松上阵,但是千分之一左右粉丝是有科研经费,而且也没有时间精力慢慢看教程钻研摸索的,所以我们仍然是提供一点点学习辅导服务: Continue reading

30

绝大部分情况下,我们其实是不知道如何提问

有意思的是,如果能合理的提问,绝大部分问题其实就可以自己抽丝剥茧的解决掉

最近有一个学徒非常执着的要自费私聊提问(主要是专家咨询费),这里需要说明一下,我其实每天都会处理十几个粉丝提问,部分比较耗费时间的问题就会让大家等等,因为我也不是每天没事只做公益。除非是实在是等不及的,才需要自费紧急求助于我。 Continue reading

30

给你8个甲基化探针, 你可以在tcga数据库进行怎样的探索

我喜欢把TCGA数据库的应用划分为8个领域:

  • 1、探索各类肿瘤不同临床特征(性别、年龄、种族、临床分期)的预后(生存曲线)
  • 2、探索各类肿瘤与对照的单个分子(mRNA,lncRNA,miRNA,甲基化,蛋白)水平的差异情况(箱线图)
  • 3、探索各类肿瘤与对照的全局(mRNA,lncRNA,miRNA,甲基化,蛋白)水平的差异情况(差异分析流程) Continue reading