前面我们一起学习了单细胞转录组数据的上游分析,而且了解了自己的项目的样本数量和测序量,还过滤了不合格的细胞和基因, 教程目录如下:
Monthly Archives: 3月 2020
并不是只有TCGA计划里面的癌症研究才做多组学
前列腺癌是一种相对惰性的恶性肿瘤,但是一旦其进入晚期,治疗将会变得十分棘手。虽然大多数晚期前列腺癌患者对内分泌治疗都有很好的反应,但在治疗18~24个月后几乎所有患者最终都将进展为去势抵抗性前列腺癌(CRPC),而一旦进展为CRPC,一半患者将难以活过两年。因此,识别哪种前列腺癌更易进入CRPC,并对此及早进行积极的综合治疗是延长生存期的重要环节。 Continue reading
表达矩阵逆转为10X的标准输出3个文件
本文首发于生信菜鸟团公众号,直达链接是https://mp.weixin.qq.com/s/NaZ5kz3ew2O01cFEnK8sXg
今天接到浙江大学的学徒求助,他在学习
TooManyCellsR
包和too-many-cells
软件的过程中遇到了一个很有趣的问题,就是这个软件的输入必须是 cellranger 的三个结果文件,matrix.mtx
,barcodes.tsv
和genes.tsv
。而有些公共数据并不会提供3个数据,比如: SE117988_raw.expMatrix_PBMC.csv.gz , 就是 10x的表达矩阵。 Continue reading
把一本R语言书看五遍还是看五本不同的书
我一直强调,编程基本功必须得看工具书,而且是需要看五本以上,甚至部分书籍需要看五遍以上!比如我在生信分析人员如何系统入门R(2019更新版) 里面给初学者的知识点路线图如下: Continue reading
49G的TCGA数据库给你下载好啦
昨天我们生信技能树分享了 TCGA数据库免疫相关文件下载大全,里面给出来了2018年4月Immunity杂志上发表的文章The Immune Landscape of Cancer 整理好的49G的TCGA数据库文件,其中一个是甲基化信号值矩阵,单个文件就39G。 Continue reading
8个10X单细胞转录组样本的数据合并
发表在2017年10月的NC文章:Differentiation dynamics of mammary epithelial cells revealed by single-cell RNA sequencing 用10X单细胞转录组测序来探索小鼠的乳腺发育情况,包括了4个发育阶段: Continue reading
4门统计学你选择哪个
统计学的重要性毋庸多说,基本上NGS数据分析的每个环节参数的把握,每个图表的理解背后都是统计学背景知识。当然了,对大量入门级别玩家,暂时可以不要考虑那么多,先跟着我在生信技能树的教程肝下去,走出一个完整项目再说。但是大量中高级玩家的需求我们也得满足啦,很久以前我们整理过:统计学回顾(精华目录收藏)(statquest+协和八+ NGSHotpot),可以说啃这块统计学硬骨头是提升自己的生信段位不二选择! Continue reading
TCGA数据库的各个癌症甲基化芯片数据重新分析
我们前面教程:450K芯片上面的甲基化探针到底需要进行哪些过滤 已经强调过了甲基化芯片数据分析的一些注意事项,以及标准代码,共享了大量的学习资料。也分享了一篇甲基化芯片文献的标准图表,现在需要进行数据挖掘了。 Continue reading
cox生存分析结果也可以火山图可视化
昨天上午在群里看到有小伙伴问了一个很有意思的问题,就是cox生存分析结果也可以火山图可视化,而且他提问的方式值得鼓励,所以我回答了他,并且把代码分享出去了。 Continue reading
cox可以火山图为什么gsea结果不行
前面我在生信技能树分享过 批量cox生存分析结果也可以火山图可视化 介绍了火山图的基础认识,同时也给了大家代码可以批量做cox分析,并且绘制出来火山图。 Continue reading
这一个图背后是12个差异分析的综合
我们的免费数据分析活动吸引了大量的粉丝, 这个春节我一个人就做了一百多个项目,很充实!如果你也需要免费的数据分析,直接看文末。
一个看似很复杂的项目
今天我们分享其中一个数据分析委托任务,粉丝来信是给我一个参考文献,想在LUSC里面重复下面这个LUAD结果。 Continue reading
英国癌症中心的生信暑期学习班
相信TCGA和ICGC对搞癌症多组学研究的朋友们来说,应该是不陌生了:
- The Cancer Genome Atlas (TCGA)
- International Cancer Genome Consortium (ICGC)
海量的数据对绝大部分研究者来说只能是望洋兴叹,所以英国癌症中心一直在为推广NGS技术产生的各种各样的数据分析而努力,近3年的生信暑期学习班含金量颇高。而且在朋友圈看到好几个人分享这个生信暑期学习班,有必要我在生信技能树也专门分享一下。 Continue reading
一大波CNS文章等你来读
一眨眼,我们单细胞天地又持续输出了一年,但是我们团队毕竟不是科研服务公司,没有人付费养着我们做研发。所以现有团队时间和精力实在是有限,尤其是单细胞领域高速飞奔,CNS文章发表的速度远超我们能提供的详细解读速度! Continue reading
线性混合效应模型
本期我们学习的文章是Integrated transcriptomic analysis of distance-related field cancerization in rectal cancer patients ,文章思路如下图所示:取肿瘤不同距离处样本,测序,找到表达量与距肿瘤远近相关的基因,然后进行功能注释、生存分析等等。
学习任务是:用lme4
构建线性混合效应模型,找到表达量与距离相关的基因。 Continue reading
下载GEO数据太慢?快用axel
以下笔记分享来自于2019-11月学徒:
因为国内需要下载GEO芯片原始数据,但是下载速度真的感人,只有几k。老是找海外的朋友又觉得不好意思,所以就看看github大神有没有什么办法,果然找到了!!! Continue reading
我用这个技能一杯咖啡的功夫就挣了800块钱
昨天我们在生信技能树解读了 从招聘信息看一个合格的生信工程师该会哪些 ,朋友圈有一小撮人冷嘲热讽,说辛辛苦苦学了那么多,工资也就万把块钱每个月。我就呵呵,谁让你当年选择了生物呢?本来应该是去卖保险信用卡股票期货的你,因为遇到了生信,有幸找到一份养家糊口的工作你还得寸进尺?好不容易你才走入了社会正常运转的一环,成为一个不可或缺的螺丝钉,对没有背景的你来说,已经是鲤跃龙门啦! Continue reading
我可以为你做些什么
原文链接在微信:https://mp.weixin.qq.com/s/KZ0H8BtMgAH4iActOuDLIA
自我隔离在家一个多月了,除了最开始号召粉丝在家里看视频搞学习,分享了 华清大学、京北大学联合发现:#学习R语言之数据挖掘可抑制新型冠状病毒#,因为确实宅家是目前有效的防范冠状病毒的手段之一。 Continue reading
为什么我没有给你免费培训
很多粉丝一直有一个疑问,为什么我全部的教程免费在生信技能树,生信菜鸟团,单细胞天地,而教学视频免费在B站,YouTube等。偏偏一个简单的生信入门反而收费,不过是讲解最基础的R包安装,数据类型,数据结构,函数,循环这样看起来烂大街的知识点而已。
- 详见:全国巡讲全球听(买一得五) ,你的生物信息学入门课! Continue reading
为什么不把你现有Mac资源用好
很多粉丝在询问是否能参加我们的 全国巡讲全球听(买一得五) 课程都喜欢问一个问题,自己的电脑比较旧了,能否跟得上课程。其实呢,如果仅仅是从授课角度,4G内存的电脑都ok的,但是你学了生物信息学这么强大的技术,如果还使用那么烂的电脑,我感觉你会陷入巧妇难为无米之炊的尴尬处境。早在两年前我就分享过 个人计算机推荐,然后很多人就此次抛弃了Windows,投入Mac的怀抱,但是呢,第一步居然把自己的Mac电脑安装一个Windows操作系统??? Continue reading
使用monocle做单细胞谱系发育
我们在单细胞天地发布的全网第一个单细胞转录组课程,精炼了常规单细胞转录组数据分析主线,就是5大R包, scater,monocle,Seurat,scran,M3Drop,然后10个步骤:
-
step1: 创建对象
-
step2: 质量控制
-
step3: 表达量的标准化和归一化 Continue reading