表达量是否有差异你说了算

有小伙伴在交流群问:自己的目标基因在做完表达量差异分析后发现它并不在上下调列表里面,感觉有点惶恐,如果是真实现象,那么:

  1. 基因表达量无显著差异:这是最直接的可能性。在你研究的条件或处理下,该基因的表达量可能并未发生显著改变。
  2. 样本差异大:如果你的样本间的差异过大,可能会影响到差异表达分析的结果。例如,如果一部分样本中该基因表达量上调,而另一部分样本中该基因表,所以导致数据分析结果是无差异。
    实际上,绝大部分情况下,仅仅是因为我们对数据的了解不够。这样的疑惑很容易发生在没有太多数据处理经验的初学者身上,他们过渡依赖于标准流程和“师兄师姐”传递下来的代码,或者说太依赖各种参数和阈值,不敢大胆的反抗软件分析的结果。。。。
    比如2019年Science Advances上发表的一项新研究,标题是:《ITGA5 inhibition in pancreatic stellate cells attenuates desmoplasia and potentiates efficacy of chemotherapy in pancreatic cancer》初步得到了整合素α5 (ITGA5)在胰腺癌发挥癌基因的作用,也就是说它在癌症里面相对于癌旁来说是恶性高表达的,而且表达量越高病人预后就越差。。。
    可以看到,这个研究的作者为了说明整合素α5 (ITGA5)在胰腺癌发挥癌基因的作用,使用了生存分析图加上表达量箱线图,而且都达到了统计学显著性。
    达到了统计学显著性
    这样无可厚非,毕竟是为了发文章, 肯定是得凑阳性结果啦。
    但是如果你只细看表达量,其实是专注于研究肿瘤微环境的Jai Prakash教授,带领研究团队检查了约140位胰腺癌患者的组织样本,分析预后差异和肿瘤整合素α5 (ITGA5)的蛋白表达量阳性与否分组后的生存分析。你必须首先相信他们团队收集整理的病人信息是ok的,其次你得相信他们的组织芯片是ok的,然后大多数情况下,这两个环节的可能的错误经常会发生。
    其次,那个表达量箱线图是 (D) Transcriptomic analysis of ITGA5 in publicly available microarray dataset (GSE28735). 如果你去处理 GSE28735 这个表达量芯片数据集,参考我们的代码:

Comments are closed.