17

双重高斯分布拟合

高斯分布在自然界非常常见,中心极限定理很好的说明了它,但事情往往不是那么地纯粹,很多时候我们得到的结果里面会混入两个截然不同的样本数据集,虽然它们各自都是高斯分布,但是它们的均值和方差都不一样,如果拿到的是它们的混合数据,就不能简单的使用一个高斯拟合来处理它了。 Continue reading

17

使用SNFtool包整合多组学数据进行病人分组

大家都喜欢整合多组学数据,实际上目前大多数研究都是拿其中一种组学数据来对样本进行分类,然后查看病人分组后另外一种组学的差异情况。再其次,就是整合多组学数据对样本统一分组。

案例介绍

看到文章 Integrative analysis of the inter-tumoral heterogeneity of triple-negative breast cancer 针对137个TNBC病人的3种数据,进行挑选后,各自进入NMF聚类:
Continue reading

16

生信分析人员如何系统入门R(2019更新版)

五年前作为一个初出茅庐的菜鸟生信工程师苦于没有专业交流社群,遂自建了生信菜鸟团QQ群和博客,一点一滴积累了数万人气,进而和若干圈内好友组建了生信技能树联盟,三年前的直播生物信息学编程活动细节还历历在目,QQ群微信群记账录制视频忙的不亦乐乎,因此产生了编程语言系统入门系列教程,如下: Continue reading

16

生存分析时间点问题

以前下载TCGA数据,喜欢使用UCSC的XENA数据库, 全部数据在:https://xenabrowser.net/datapages/ 这个时候有两个数据源,需要区分开来;

16

七月nature海鞘九月science线虫

众所周知,单细胞水平的研究目前主要集中在发育,免疫和癌症方向,但是哪一个细分领域的CNS文章更多呢?感兴趣的朋友可以通过文本挖掘追踪最新文献,进行统计。刚才看到单细胞天地群朋友分享了2019的两篇文章,分别是七月nature的海鞘,和九月science的线虫,都是发育方向的。
从单细胞转录组数据分析的角度来说,大部分图表均可复现,但是生物学背景这一块就很头疼了,太多的专有名词。 Continue reading

16

破解肿瘤细胞的病人特异性之谜

看过单细胞水平的癌症研究的朋友都应该是对下面这幅图不陌生:

可以很清晰的看到,多个病人的单细胞可以分成恶性的上皮细胞和非恶性的肿瘤微环境,微环境的那些细胞可以聚集成为很多类,而且每个类别的细胞都是来源于不同病人的。
但是呢,对于那些肿瘤恶性细胞,也是聚集为很多类别,但基本上每个类别都是一个单独的病人来源。 Continue reading