最近打理自己的生信菜鸟团博客发现阿里云又开始搞活动了,这次虽然不是2年免费,不过也差不多,三年才五百多块钱! Continue reading
学徒实习生数据挖掘成果展(生物信息学)
神技能-自动化批量从PDF里面提取表格
最近给学徒布置了一个作业,是一篇文章的数据图表重现,如下:
想做单细胞数据分析,完成一个R考核题
打开你的Rstudio,运行下面的代码: Continue reading
听说Excel表格动了你的基因名?
为什么要学编程
帮同学处理一下他从公司拿到的差异分析结果,当然,给我的是Excel表格,老规矩,导出csv然后读入R,然后准备顺手画个火山图,做个GO/KEGG富集分析。下意识的看了看数据结构,然后顺手按照基因名排序了一下,哈哈哈~ Continue reading
hg38按照200k分区间统计测序深度及GC含量
多位点取样探索肿瘤异质性的研究集锦
2012-新英格兰-4个ccRCC病人的26个肿瘤部位
Endesfelder, D., Math, D., Gronroos, E., Ph, D., Martinez, P., Ph, D., … Ph, D. (2012). Intratumor Heterogeneity and Branched Evolution Revealed by Multiregion Sequencing. New England Journal of Medicine.
只有4个ccRCC病人,26个肿瘤组织测序,平均测序深度74而已,是clear cell renal cell carcinoma,取样如下: Continue reading
使用DSS包多种方式检验差异甲基化信号区域
一起学一个包吧! Continue reading
基于R的可视化习题30个
基于R的可视化习题30个
可视化是一门很深的学问,详解:https://mubu.com/doc/3L0wkgGUVg 这里仅仅是出题30个,引导大家进入该领域!
这里仅仅是针对一个数据集,就是r包airway并且通过assay函数拿到其表达矩阵。 Continue reading
基于R的统计习题30个
基于R的统计习题30个
统计学是一门很深的学问,这里仅仅是出题帮助大家熟练使用R语言来学习统计学知识,具体知识点需要更深入阅读书籍或者教程:
- 推荐一下 统计学基础:https://mp.weixin.qq.com/s/OtB2h6f00U2SRZLzveJKfQ
- 统计学精华-statQuest教学视频:https://mp.weixin.qq.com/s/X0PE9S0BgSuCcAV9zeY1jQ Continue reading
(2020年4月份)第16周(总第112周 )- 单细胞基因组测序表明TNBC的CNV发展是爆发式的
非整倍体是癌症的特征之一,但是关于癌症发生发展期间二倍体基因组如何演变为非整倍体的研究仍然是不够,所以发表于Nat Genet. 2016 Oct; 的文章的作者纳入了12个TNBC病人,测了他们的1000个单细胞基因组序列。来探索是否应该是 punctuated copy number evolution (PCNE) 模型。 Continue reading
(2020年4月份)第15周(总第111周 )- 多位点取样外显子测序看食管癌的肿瘤内部突变异质性
本研究发表于 Nat Commun. 2019 Apr ,题目是:Multi-region sequencing unveils novel actionable targets and spatial heterogeneity in esophageal squamous cell carcinoma. 纳入 39个ESCC病人,然后取肿瘤样品 185个,146个原位癌症样品和21个淋巴结转移样品。不仅仅是肿瘤外显子测序,还有一些TCR测序。 Continue reading
(2020年4月份)第14周(总第110周 )- 卵巢癌领域的第二个类器官研究
前面我们介绍过卵巢癌领域的第一个类器官研究,发表于 September 13, 2018,题目是:Prediction of DNA Repair Inhibitor Response in Short Term Patient-Derived Ovarian Cancer Organoids 研究者共成功制备了33 organoid cultures derived from 22 HGSC patients ,但是做的数据分析很少,常规的WES+RNA测序数据,而且做的是短期培养,最后研究者从IHC结果还有SNV/CNV全景图来说明病人的肿瘤样品与其培养的类器官匹配情况。数据在phs001685.v1.p1需要申请才能下载。 Continue reading
(2020年4月份)第13周(总第109周 )- 中国人群肺癌队列的多组学探索
通常多组学就是全外显子和转录组而已,这个规律早就提现在了各个国家地区的队列之中,本研究也不例外,发表在:Nat Commun. 2019 Apr,是中国肺癌研究领域比较出名的吴一龙课题组 Continue reading
(2020年3月份)第12周(总第108周 )- 单细胞转录组探索小鼠性腺发育
单细胞转录组技术在发育生物学领域应用的最为成熟和广泛,单细胞领域大拿汤富酬就是在发育生物学方向颇有建树。本次要分享的两篇文章:2018, Cell Reports 和 2019, Cell Reports是同一个研究团队的成果,2018的研究是是取Tg(Nr5a1-GFP) 雄性小鼠的睾丸在 5个发育时间点 (E10.5, E11.5, E12.5, E13.5, and E16.5) 进行单细胞转录组测序,2019的研究是Tg(Nr5a1-GFP) 转基因小鼠的性腺在6个发育时间点 (E10.5, E11.5, E12.5, E13.5, E16.5, and post-natal day 6 [P6])。 Continue reading
寻找生存分析的最佳基因表达分组阈值
昨天我们提到了任意更改基因表达分组阈值生存分析结果大不一样:https://mp.weixin.qq.com/s/pQL8jA38gDPO5xVDG0L94w Continue reading
集思广益-生存分析可以随心所欲根据表达量分组吗
很久以前我们提到过TCGA的各种网页数据库的生存分析结果冲突的问题,现在又有人提出来一个新的问题,如下: Continue reading
100篇泛癌研究文献解读之原位癌症和转移癌症的区别
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
发表于普通杂志:Mol Cancer Res. 2019 Feb; 文章是:Molecular Correlates of Metastasis by Systematic Pan-Cancer Analysis Across The Cancer Genome Atlas. 系统性的研究了TCGA数据库的11种癌症的 4,473 primary tumor samples and 395 tumor metastasis samples ,发现不同癌症的 转移和原位癌的表达差异都很大,不同癌症有一些overlap情况,当然除了比较mRNA-seq数据,还有miRNAs,RPPA, DNA methylation 的数据的比较探索。还利用了 Gene expression data (TPM values) from GTEx Analysis version 7 数据库,也有一些GEO数据库的,比如GSE110590。 Continue reading
100篇泛癌研究文献解读之肿瘤免疫浸润情况
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
本研究发表于 Clin Cancer Res. 2018 Aug ,题目是:A Pan-cancer Landscape of Interactions between Solid Tumors and Infiltrating Immune Cell Populations. 系统性的研究了 9,174 tumors of 29 solid cancers 的免疫浸润情况。这些免疫数据都是可以在 https://gdc.cancer.gov/about-data/publications/panimmune 下载的。本来我以为这篇文章做的很简单,以为下载 panimmune 数据就好,但是看了文章的附件,我才知道,我想的简单了。 Continue reading
100篇泛癌研究文献解读之上皮细胞-间充质细胞转化
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达)
发表于 Dev Dyn. 2018 Mar;的研究,题目是:Pan-cancer survey of epithelial-mesenchymal transition markers across the Cancer Genome Atlas. 系统性的分析了32个癌症的一万个病人的数据,主要集中于 16-gene signature of canonical EMT markers 跟前面的 Sci Rep. 2013 Oct 和 Nat Commun. 2014 Sep ,还有 Nucl Receptor Res. 2015 Dec 类似的地方,都是研究固定有生物学意义的基因集。 Continue reading