最近在B站重新学习我自己的视频课程,发现一个ID为学什么不好非要学生物的小朋友搬运了大量的生物信息学公开课,都是中国大学MOOC,我简单看了看课程设置,知识点目录。总算是明白了为什么很多人虽然是生物信息学科班出来的,但是仍然是不会处理各种各样的NGS组学数据,甚至简单的芯片表达矩阵或者信号值矩阵也是很勉强。 Continue reading
中国大学MOOC的生物信息学之华中农业大学
我们首先在生信技能树分享了:中国大学MOOC的生物信息学公开课之河南科技大学 不知道学习的朋友多不多,反正留言参与推荐高校生物信息学课程改革的朋友很少。 Continue reading
中国大学MOOC的生物信息学之山东大学
昨天我们在生信技能树分享了:中国大学MOOC的生物信息学公开课之河南科技大学 ,然后在生信菜鸟团分享了:中国大学MOOC的生物信息学之华中农业大学
不知道学习的朋友多不多,反正留言参与推动高校生物信息学课程改革的朋友很少。 Continue reading
肿瘤研究神级教材-癌生物学
最近整理自己的书房,发现很多好书已经被束之高阁长达五年,也有一些是学徒带过来的经典,比如《癌生物学》,看了几十页,爱不释手,想起来珠江肿瘤的robin组织过他那边的学生写过这本书的笔记,所以借花献佛分享给我们生信技能树的粉丝。 Continue reading
肿瘤异质性如何影响诊断
我在上海国际乳腺癌论坛(SIBCS)公众号看到他们解读的《人间世》第二季第五集《抗癌之路:癌症的黑匣里仍有微光》,值得分享:
同样的病人在上海复旦大学附属肿瘤医院检查被判断为三阴性乳腺癌,但是赴美就医,在 安德森医院 的穿刺报告显示她的肺部转移灶雌激素受体呈阳性。不同的诊断结果,意味着不同的治疗方案。 (其实原发灶和转移部位本来就是可以不同亚型的啊!) Continue reading
周六文献阅读目录
Agilent芯片表达矩阵处理
Agilent的芯片同样也是扫描得到图片,然后图像处理(主要是Agilent Feature Extraction (AFE) 软件)得到信号值,但是值得注意的是,这个时候有两个信号值矩阵,分别是:the background matrix Eb as well as for the foreground matrix E. Continue reading
GitHub的R包毕竟没那么可靠
最近又需要使用一个肿瘤外显子看cnv的R包,根据全局的vcf文件,就是FACETS,发表该包的文章是:FACETS: allele-specific copy number and clonal … - NCBI - NIH
是大名鼎鼎的MSKCC单位的研究人员开发的, 作者:R Shen - 2016 - 被引用次数:189 - 相关文章 Continue reading
HTA芯片(学徒探索任务)
年前我们布置过一个 agilent芯片的探索任务,很可惜,没有人接单,也许是得等我某一天遇到了,或者时间充裕了会去解决它吧!现在再来一个疑难杂症吧,就是生不逢时的Affymetrix Human Transcriptome Array 2.0芯片的数据处理。
前面我提到过[HTA-2_0] Affymetrix Human Transcriptome Array 2.0芯片的分析其实挺麻烦的,首先需要搞清楚下面3个平台的差异: Continue reading
GPL13607平台的LINC01666的探针到底应该是哪个
你只需要去查询gencode数据库,就可以看到LINC01666的的坐标是已知的, ENSG00000279579 chr21 8759077 8761335,长度也就是2kb多一点而已,所以在上面设计探针的话应该是不会太多的。请大家记住这个坐标:chr21:8759077-8761335 Continue reading
log与否会改变rpkm形式表达矩阵top的mad基因列表
我在生信技能树多次写教程分享WGCNA的实战细节,见:
TCGA和METABRIC的TNBC病人数量到底是多少
因为自己博士课题是关于乳腺癌肿瘤异质性的研究,所以对这个癌症的背景知识稍微多一点。顺理成章的我出的大量学徒作业也是关于乳腺癌的,其中乳腺癌里面最恶性的就是TNBC,或者说三阴性乳腺癌啦。看到了不下50篇TNBC相关数据挖掘文章,基本上都是TCGA或者METABRIC数据库啦,但是不同文章对TNBC定义有冲突,而且样本数量都不一致,很是尴尬! Continue reading
TCGA数据库单基因gsea作业之COAD-READ
我前面写过 单基因GSEA分析策略(数据分析免费做活动继续) ,然后马上就碰到了一个求助,复现下面的图表!
发表在Cancer Management and Research的简单数据挖掘杂志:Apolipoprotein C1 (APOC1) promotes tumor progression via MAPK signaling pathways in colorectal cancer,仔细下载文献学习。 Continue reading
WGCNA得到模块之后还可以看里面基因的connectivity
我在生信技能树多次写教程分享WGCNA的实战细节,见:
cytoscape的cytohubba及MCODE插件寻找子网络hub基因
我特别不喜欢写网页工具或者鼠标点点点的软件操作指南,因为感觉就跟QQ软件一样,自己摸索就ok了,所以我的cytoscape十讲就一直处于施工阶段:
- Cytoscape十讲之网络图的认知
- Cytoscape十讲之下载
每次都是写到一半,就弃稿了! Continue reading
- Cytoscape十讲之下载
一个甲基化芯片信号值矩阵差异分析的标准代码
本来呢,我的GitHub已经有一个GEO项目了,上面罗列了我大量的表达矩阵数据分析代码,理论上这个甲基化芯片信号值矩阵差异分析也是属于GEO公共数据库挖掘。 Continue reading
rstudio软件无需联网但是
每次开展R语言线下学习班,都需要重新发几次:Windows电脑使用Rstudio会有多少错误呢,虽然大部分同学都是可以根据我们的教程顺利解决问题,但是不幸的人各有各的不幸。一般来说就是Windows电脑的中文用户名需要修改电脑系统的环境变量,R包下载等等。 Continue reading
PCAWG计划-原发肿瘤的WGS数据整合分析
TCGA的Pan-Cancer早在2013就系统性提出来并且规划好了,见Nat. Genet. 2013 45:1113),因为TCGA计划涉及到数据类型比较多,仅仅是DNA层面就有WGS、WES、SNP6.0芯片的数据,其中一万多个病人里面有WGS数据的有两千多个病人,而PCAWG计划就是整合所有的WGS数据结果。 Continue reading
oligo包可以处理agilent芯片吗
在文献 J Natl Cancer Inst. 2018 Jul ;题目是:Intratumor Heterogeneity of the Estrogen Receptor and the Long-term Risk of Fatal Breast Cancer,看到该研究使用的是agilent表达芯片,老实说我其实不太喜欢这个公司的芯片,从数据分析的角度来说,因为其R包非常少。不过作为生信技能树,我们不得不全面建设不同类型数据分析流程,所以还是硬着头皮啃一下这个数据分析: Continue reading
Nanostring的表达矩阵分析也是大同小异
最近课题组的文献分享会议上有一篇文章里面的生存分析和差异分析吸引了我的注意,所以分开介绍一下,并给出了学徒任务,希望大家可以自行抽空完成。文章发表于July 25, 2019 的JCI杂志,标题是 STING activation reprograms tumor vasculatures and synergizes with VEGFR2 blockade Continue reading