最近有粉丝咨询我多个gsea数据集整合时候的批次效应的处理,我看了看,有affymetrix,agilent,illumina的芯片数据,还有测序的转录组,我勒个去,感觉是在集邮一样,然后邮件附上了一大堆热图,层次聚类图,PCA图,相关性图,看得我眼花缭乱。 Continue reading
Category Archives: 未分类
发挥如此关键作用的单细胞居然不配出现在正文图表
我前面吐槽了这个2020年10月发表在cancer cell杂志的文章《Senescence Reprogramming by TIMP1 Deficiency Promotes Prostate Cancer Metastasis》,链接是: Continue reading
借鉴escape包的一些可视化GSVA或者ssGSEA结果矩阵的方法
前面我在《生信技能树》公众号分享了 对单细胞表达矩阵做gsea分析的付费代码,大受欢迎,是对指定的两个单细胞亚群进行差异分析后,根据基因的差异情况排序,然后去msigdb数据库里面进行gsea的注释,并且批量出图,在实际数据分析中非常的有用。 Continue reading
开局50基因可以分析什么
有粉丝在我们公众号后台咨询,基因名字没有什么规律,自己拿到了一堆基因不知道如何是好,希望我们给一个案例。 Continue reading
拷贝数全景图聚类分群找差异
目前大家都在集中精力在单细胞转录组表达矩阵的质控降维聚类分群和注释,其实这个数据分析思路并不仅仅是在单细胞这个当红炸子鸡上面才有。 Continue reading
明码标价之单细胞转录组的质控降维聚类分群和生物学注释
单细胞转录组的质控降维聚类分群和生物学注释例子我们在《生信技能树》和《单细胞天地》都多次分享过:人人都能学会的单细胞聚类分群注释 。 Continue reading
明码标价之公共数据集的WGCNA
最近有粉丝在我们《生信技能树》公众号后台付费求助,想follow一个文章 做他自己感兴趣的一个数据集的WGCNA分析。 Continue reading
谁说单细胞工具一定要应用于单细胞数据呢
最近读文献, 看到了一个有意思的文章,发表在 Nat Commun . 2021 Jan 的文章:《Global computational alignment of tumor and cell line transcriptional profiles 》提到了一个工具,Cellinger,链接是:https://www.nature.com/articles/s41467-020-20294-x Continue reading
谁说样本一定要按照编号排序呢
学徒培养进行到了转录组实战环节,按照惯例我会挑选10+篇比较新的带数据集的RNA-seq文章给到学徒,让大家实战。 Continue reading
什么才是生物信息学呢?
看到了朋友圈有人转发了这样的一个系列:
单细胞转录组研究的同时也可以加上传统bulk转录组
在朋友圈刷到了这个文章,2020年1月4日,中国医学科学院北京协和医学院朱兰及中国科学院北京基因组研究所杨运桂共同通讯在Nature Communications 在线发表题为“Single-cell transcriptome profiling of the vaginal wall in women with severe anterior vaginal prolapse”的研究论文,链接是:https://www.nature.com/articles/s41467-020-20358-y Continue reading
基因集的转录因子富集分析
一般来说,大家拿到了感兴趣的基因集后,通常是做超几何分布检验看看富集到了什么生物学功能数据库,比如KEGG或者GO数据库,或者走gsea/gsva这样的富集分析,也是注释生物学功能数据库。 大家读我的表达芯片的公共数据库挖掘系列推文应该是够多了: Continue reading
今天讨论新冠病毒明天讨论单细胞
在朋友圈看到了一个2020年6月发表在Nature Medicine的单细胞TCR测序结合单细胞测序,研究新冠病人免疫图谱的文章,蛮有意思的。作者用单细胞转录组测序技术对不同程度的新冠患者(3例中度感染患者、6例重度感染患者)和健康对照组(3例)的支气管肺泡灌洗液(BALF)免疫细胞进行了鉴定。最后获得31个不同的cluster,比如,巨噬细胞,中性粒细胞、髓样树突状细胞、浆状树突细胞、NK细胞、血浆细胞、上皮细胞、T细胞、B细胞等。比较了健康人、中毒感染患者、重度感染患者的细胞数目差异以及差异表达基因,分析新冠肺炎患者肺泡灌洗液中的免疫图谱。 Continue reading
什么时候细胞周期的分类作用大于细胞类型呢
众所周知,在肿瘤单细胞数据里面,对恶性细胞来说,病人的分类作用是远大于细胞类型的,不过其实肿瘤恶性细胞也说不出什么确切的细胞类型,目前仅仅是根据TCGA的bulk转录组数据进行分子分型。但是对免疫细胞或者其它并不恶性的单细胞来说呢,细胞类型的作用是远大于病人的个体异质性的。如下所示: Continue reading
新的ngs流程该如何学习(以CUT&Tag 数据处理为例子)
NGS流程层出不穷,哪怕是以我持续7年累积写作1.3万篇教程的高产来说,也没办法囊括全部的知识点。但是只需要学到了我的知识整理方法,对一个入门级别工程师来说,摸索新流程其实并不难!这里,我们以CUT&Tag 数据处理为例子,因为今早起来我在朋友圈看到了“二货潜”的分享,非常认真的一个小伙伴,他给CUT&Tag 数据处理写了一个手把手教程,没有遇到应有的读者,值得大力推荐: Continue reading
单细胞RNA测序中的批次效应(二)
cytof数据处理难点之修改FCS文件
前面我们已经完成了cytof数据处理的主要步骤,读入文件,质量控制,降维聚类分群,生物学注释和细胞亚群比例差异分析。 目录如下: Continue reading
第三次分群,以T细胞为例(CNS图表复现20)
前面我们展现了 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,然后呢,第二次分群的上皮细胞可以细分恶性与否,免疫细胞呢,细分可以成为: B细胞,T细胞,巨噬细胞,树突细胞等等。实际上每个免疫细胞亚群仍然可以继续精细的划分,以文章为例: Continue reading
单细胞差异表达简单探索
并不一定要单细胞转录组才能看肿瘤免疫微环境个细胞亚群比例
我注意到绝大部分肿瘤相关的单细胞转录组研究的落脚点都是在肿瘤免疫微环境个细胞亚群比例,包括 B细胞,T细胞,巨噬细胞,树突细胞等等,而且这些细胞亚群都是可以继续细分。但实际上在没有单细胞转录组数据这个技术之前,也是可以探测肿瘤免疫微环境个细胞亚群比例的,比如流式细胞仪。但是我查了一下,发现这个仪器还蛮贵的,比如一个招标信息《上海交通大学流式细胞分选仪,200万》: Continue reading