你们的相关性可能只是第三者插足

很多人挖掘公共数据库,比如TCGA等,会喜欢用到相关性分析,就是寻找那些表达量相关性比较高的, 然后就认为他们之间具有调控关系,可能是某些模块,但是我最近看的一篇文章,提到了这样的相关性其实是比较容易受其他因素影响,比如肿瘤纯度,如下图:

这里的肿瘤纯度,使用 a consensus measurement of purity estimations (CPE)指标,其实就是多种肿瘤纯度方法的整合。
可以看到,colony-stimulating factor 1 receptor (CSF1R) and Janus kinase 3 (JAK3) 两个基因的表达量在bladder癌症里面可以说是非常相关了,但其实是它们两个基因都受肿瘤纯度的影响。
统计学一直是生信技能树我们推荐学习的重点,的确不是很好讲解,希望大家多留心自学吧。

Comments are closed.