最近给学徒布置了一个作业,是一篇文章的数据图表重现,如下: Continue reading
Daily Archives: 2020年1月18日
染色体全局可视化
这并不是最佳选择方案,因为前些天菜鸟团的
先安装 ChromHeatMap 包,里面存放有 cytoBand坐标信息,可以简单检查一下。 Continue reading
你只有9例病人肿么办
现在做肿瘤队列研究,纳入病人数量不过百都不好意思出来交流了,但是,并不意味着你的样本数量少,你的研究就没有意义,当然,部分稀有癌症本来就不可能是样本量大。
但是假如你做的并不是稀有癌症,又的确没有经费或者其它条件不允许,只能说是不到10个病人,数据也出来了,仍然是想发出去肿么办? Continue reading
你们的相关性可能只是第三者插足
很多人挖掘公共数据库,比如TCGA等,会喜欢用到相关性分析,就是寻找那些表达量相关性比较高的, 然后就认为他们之间具有调控关系,可能是某些模块,但是我最近看的一篇文章,提到了这样的相关性其实是比较容易受其他因素影响,比如肿瘤纯度,如下图: Continue reading
集思广益-生存分析可以随心所欲根据表达量分组吗
很久以前我们提到过TCGA的各种网页数据库的生存分析结果冲突的问题,现在又有人提出来一个新的问题,如下: Continue reading
基于R的统计习题30个
统计学是一门很深的学问,这里仅仅是出题帮助大家熟练使用R语言来学习统计学知识,具体知识点需要更深入阅读书籍或者教程: Continue reading
基于R的可视化习题30个
可视化是一门很深的学问,详解:https://mubu.com/doc/3L0wkgGUVg 这里仅仅是出题30个,引导大家进入该领域!
这里仅仅是针对一个数据集,就是r包airway并且通过assay函数拿到其表达矩阵。 Continue reading
还缺医学图像影像处理素材吗
提到医学图像影像数据,必须首推TCGA数据库啊,在 https://www.cancerimagingarchive.net/ 动辄都是几十个GB的数据,如下,GBM的120个样本的数据量: Continue reading
工信部自己修改网址,锅却得我们来背
相信生信技能树的粉丝们都应该还记得六月末的生信菜鸟团博客被关闭的风波吧,上面提示是我的备案信息有问题,实际上呢,我检查了很久,发现是工信部自己修改网址导致我的WordPress博客里面的跳转失败! Continue reading
工具marker基因定义细胞类群
现在流行的单细胞转录组测序是10X的,通常一个样本就可以达到好几千的细胞,所以一次10个样本的实验,拿到上万个细胞非常正常。
很容易通过 monocle, seurat, scater 等一站式单细胞转录组处理工具来进行降维聚类分群,如下: Continue reading
跟着jimmy玩博客
最近打理自己的生信菜鸟团博客发现阿里云又开始搞活动了,这次虽然不是2年免费,不过也差不多,三年才五百多块钱!
https://wanwang.aliyun.com/hosting?spm=5176.200021.297964.9.3e7d4e358nFA7U Continue reading
根据甲基化探针信号值把样本分成CIMP组
看到文章 PLoS Genet. 2016 ,提到了 CpG island methylator phenotype (CIMP) subtype Continue reading
菜鸟团周一数据挖掘专场-第一期
第一批学徒已经出师,他们的作业如下:
- TP53突变型和TP53野生型BRCA病人的差异分析结果 https://mp.weixin.qq.com/s/Phu-MxA0d079HdtBWTHbWg Continue reading
不明白为什么一个错要出现多次
第二次出现的错误
踩过坑,才足够刻骨铭心!
这里正好推荐一下这个视频:https://www.bilibili.com/video/av28813815/?p=9
跑完一个RNA-SEQ项目,下意识的看了看bam文件大小,还有最后的文库统计情况,发现非常的诡异,首先是bam文件大小就很奇特: Continue reading
标准科研文章
[TOC]
背景知识
adeno-CRPC 和 NEPC区别
两个细胞系:
- LNCaP,人前列腺癌细胞LNCaP克隆FGC是从一位50岁白人男性(血型B+)的左锁骨淋巴结针刺活检中分离,该患者经确诊为前列腺癌转移。
- PC3 Continue reading
癌症相关突变只有不到4成会转录
在发表于2012的nature上关于104个TNBC病人的多组学队列的研究 RNA-seq数据与基因组/外显子组数据的比较显示,在转录组序列中仅观察到36%的经验证的体细胞SNV ,统计表格如下: Continue reading
100篇泛癌研究文献解读目录列表
为了分析不同类型、组织起源肿瘤的共性、差异以及新课题。TCGA于2012年10月26日-27日在圣克鲁兹,加州举行的会议中发起了泛癌计划。参考:https://www.ncbi.nlm.nih.gov/pmc/articles/PMC6000284/ 为此我也录制了系列视频教程在:TCGA知识图谱视频教程(B站和YouTube直达) Continue reading
9个CRC病人的75个肿瘤部位的多组学看异质性
日本研究团队关于CRC肿瘤内部异质性的文章 PLoS Genet. 2016 ,在肿瘤内部异质性方向,这个研究不算早,但是多组学(WES,甲基化芯片和拷贝数芯片)是一个亮点,样本量也不错,但是发表在这个杂志让我比较惊讶,可能是他们不太在乎影响因子吧。 Continue reading
WGCNA的输入矩阵到底是什么格式
虽然我们全国巡讲课程并不讲解WGCAN内容,因为时间的确有限,短短的3天要传授给大家R语言,linux还有RNA-seq数据分析实战,希望给大家打造好的基础成为合格的生信工程师,但是我们公众号有数不胜数的高级分析教程,比如WGCNA,有了基础的大家看教程就容易很多。今天收到生信技能树201908北京站学员提问,问题描述是: Continue reading
学徒复现WGCNA文章图表
生信技能树学徒培养到现在已经正式走过了一个年头,不知道这个风雨飘摇的业务还能持续多久,一个月的时间说长也不长,能在我的陪伴下走到WGCNA环节的学徒其实不多,因为要学linux和R基础,还有4大NGS组学,大量知识点其实是学徒培养结束后漫长的数据分析生涯再接再厉。 Continue reading