看到于2017年发表在Cancer Res 杂志的文章;E3 Ubiquitin Ligase UBR5 Drives the Growth and Metastasis of Triple-Negative Breast Cancer. 做的是肿瘤外显子数据,最后是: An analysis of primary TNBC specimen by whole-exon sequencing revealed strong gene amplifications of UBR5 associated with the disease.
Continue reading
排序
两个月前的一个学徒作业:绘图本身很简单但是获取数据很难,完成率超级低,仅仅接到了不到十个邮件,而且有3个人做的是错的!!超级尴尬,其中有一个错误很明显,就是自以为是的排序,然后比对肿瘤组织和配对的正常组织的表达量,其实呢,排序错误会导致配对失败。
你还缺乳腺癌表达量数据集吗
生存分析你还是在TCGA吗?
最近有粉丝求助说他研究乳腺癌做了单细胞转录组数据,定位到了一个稀有细胞亚群,先看它感兴趣的亚群细胞特异性基因的临床意义,问我有没有除了TCGA数据库之外的其它数据库资源推荐。恰好我做这方面就顺手检索了一下,发现了 curatedBreastData 包,值得推荐!
没有什么基因芯片的探针是不能注释的
最近收到读者求助,说他感兴趣的表达量芯片数据集用到的的芯片是:[HT_HG-U133_Plus_PM] Affymetrix HT HG-U133+ PM Array Plate ,看起来跟我们授课的 hg133plus2比较类似。
临床遗传学高峰论坛(真正的凡尔赛)
朋友圈看到不少人在转发临床遗传学高峰论坛,不过我猜测
Continue reading
今天讨论新冠病毒明天讨论单细胞
在朋友圈看到了一个2020年6月发表在Nature Medicine的单细胞TCR测序结合单细胞测序,研究新冠病人免疫图谱的文章,蛮有意思的。作者用单细胞转录组测序技术对不同程度的新冠患者(3例中度感染患者、6例重度感染患者)和健康对照组(3例)的支气管肺泡灌洗液(BALF)免疫细胞进行了鉴定。最后获得31个不同的cluster,比如,巨噬细胞,中性粒细胞、髓样树突状细胞、浆状树突细胞、NK细胞、血浆细胞、上皮细胞、T细胞、B细胞等。比较了健康人、中毒感染患者、重度感染患者的细胞数目差异以及差异表达基因,分析新冠肺炎患者肺泡灌洗液中的免疫图谱。
Continue reading
基因集的转录因子富集分析
一般来说,大家拿到了感兴趣的基因集后,通常是做超几何分布检验看看富集到了什么生物学功能数据库,比如KEGG或者GO数据库,或者走gsea/gsva这样的富集分析,也是注释生物学功能数据库。 大家读我的表达芯片的公共数据库挖掘系列推文应该是够多了:
画韦恩图那么容易为什么拿到基因集却有问题
学员交流群有提问,说他虽然会绘制韦恩图了,但是想提取图中指定的元素,自己弄的代码非常笨拙,感觉是R语言学的不够好,希望我可以秀一秀高阶代码。恰好今天没有什么可以分享的,就写这个教程吧!
函数冲突报错就完了吗
一个星期前我指出来了R语言包开发的一个现象:R语言的繁荣背后何尝没有隐患,很多函数名字被多个R包使用,这样就出现了冲突,所以我们需要显示调用具体的某个R包的某个函数。
恰好被隔壁Y叔看到了,所以立马给出来了解决方案,在听说你用的函数又撞名了? 可以看到conflicted
包超级好用,专门盯着你,让你报错!
构建单细胞亚群网络(类似于细胞通讯分析)
最近一直在这里细胞通讯分析相关软件工具及原理,看到不同细胞亚群的网络图,就以为是细胞通讯分析。
Continue reading
跟着Nature Medicine学MeDIP-seq数据分析
虽然MeDIP-seq数据分析教程一直挂在我的博客(http://www.bio-info-trainee.com/)的主页,如下:
根据肿瘤突变信息计算一系列指标
文献《Multi-Omics Profiling Reveals Distinct Microenvironment Characterization and Suggests Immune Escape Mechanisms of Triple-Negative Breast Cancer》,研究者把TNBC根据免疫分成3个亚群,然后寻找Potential intrinsic immune escape mechanisms of TNBC,这个过程应用了很多突变位点的量化指标,包括:
Continue reading
繁荣背后何尝没有隐患
R语言的繁荣是毋庸置疑的,至少在科研界的地位蒸蒸日上,极大的占领了原来属于各种商业绘图软件的市场。不仅仅是在于其免费的属性,更重要的是随心所欲地自由定制。
但是参与的玩家多了之后,也会出现一些冲突。最近在运行一些三五年前的代码报错了,引发了我的思考。
多时间点取样的病人个免疫细胞亚群动态变化探索(CNS图表复现19)
文章提到其单细胞转录组数据是:We used scRNA-seq to profile 49 samples (45 lung adenocarcinomas, 1 squamous cell carcinoma, and 3 tumor adjacent tissues [TATs]) (Figure 1A), corresponding to 30 individual patients.
读取GEO数据库的单细胞转录组表达矩阵文本文件的一种方式
第三次分群,以T细胞为例(CNS图表复现20)
前面我们展现了 CNS图表复现08—肿瘤单细胞数据第一次分群通用规则,然后呢,第二次分群的上皮细胞可以细分恶性与否,免疫细胞呢,细分可以成为: B细胞,T细胞,巨噬细胞,树突细胞等等。实际上每个免疫细胞亚群仍然可以继续精细的划分,以文章为例:
第六届全国医学影像临床科研培训班“逸仙六期”公益讲座
第六届全国医学影像临床科研培训班
“逸仙六期”
公益讲座通知
Continue reading
单细胞RNA测序中的批次效应 (一)
单细胞图文复现之动脉组织细胞分类
又是老板扔来得一篇单细胞数据的文章!话不多说,撸起袖子加油干~
值得注意的是,我目前的水平只能是做到单细胞转录组数据的预处理,降维聚类分群。高阶分析还没有学到,不过隔壁《单细胞天地》有一个活动,感兴趣的可以参加一下:单细胞进阶数据分析技巧一网打尽,名额有限,大家赶快抢哈!
单细胞进阶数据分析技巧一网打尽
单细胞转录组表达矩阵的聚类分群这样的教程流程分析相信大家都已经掌握的不错了,各种技巧及细节我就不赘述了,看我在《单细胞天地》的单细胞基础10讲: