肺癌样品里面的正常的上皮细胞是什么(单细胞CNS图表复现23)

前面我们已经成功完成了《CNS图表复现专辑》的前20个关键图表的复现,现在开启第二波图表复现,会大量触及到补充图表。 目录及前面的代码总结 CNS图表复现专辑第二波开启
我们在前面的教程:CNS图表复现09—上皮细胞可以区分为恶性与否 提到了五千多个上皮细胞里面只有三千七百左右是恶性细胞,那么一千七百多个的正常的上皮细胞是什么呢?而且前些天我们 比较了copykat和infercnv这两个从单细胞转录组数据推断肿瘤拷贝数变异技术差异 ,可以看到如果混合全部的病人的上皮细胞,使用infercnv更容易判断上皮细胞里面的恶性肿瘤细胞!
其实文章也在附件里面提到:The non-cancer epithelial cell clusters (n = 16) were further annotated into cell subtypes (Figures S1D and S1E). 他们的数量如下所示:
一千七百多个 的正常的上皮细胞
可以看到正常水平细胞主要是 AT1和AT2 cells ,因为取材是肺部,因为取材跨越了不同治疗阶段(靶向治疗前(TN)、病灶残留阶段(RD)、复发阶段(PD)) ,而且不仅仅是原发肿瘤部位,如果是转移瘤里面混入及少量的肝细胞,神经细胞就可以理解了。
原文还展示了另外一种质量控制图表,就是不同细胞亚群各自的细胞测序情况,可以看到肿瘤恶性细胞的基因数量是最多的,甚至都可以使用基因数量来作为一个评价标准,来区分细胞恶性与否了!
不同细胞亚群各自的细胞测序情况
另外,其实这个图是上皮细胞的戏份,不知道为什么作者在这里要展现其算法混入的基质细胞的5个亚群,感觉完全没有必要啊!
这个时候,直接对这个上皮细胞表达量矩阵进行降维聚类分群,然后可视化 AT1和AT2 cells ,club和ciliated细胞 的 特异性 基因即可:

# epi or tumor (EPCAM, KRT19, PROM1, ALDH1A1, CD24).
# - alveolar type I cell (AT1; AGER+)
# - alveolar type II cell (AT2; SFTPA1)
# - secretory club cell (Club; SCGB1A1+)
# - basal airway epithelial cells (Basal; KRT17+)
# - ciliated airway epithelial cells (Ciliated; TPPP3+)

但是我做出来的比例跟作者不一样:
上皮细胞表达量矩阵进行降维聚类分群
而且图里面的SCGB1A1基因不明显,也就是说 secretory club cell 可能是被混入到了其它上皮细胞里面。支气管上皮组织中的Ciliated cell, club cell, goblet cell 以及 basal cell 我们差不多都可以找到了,也是绝大部分人主要关注的:

  • 基底细胞(Basal cell)
  • 棒状细胞(Club cell)
  • 杯状细胞(Goblet cell)
  • 纤毛细胞(Ciliated cell)

    那么问题来了,肺癌里面的恶性肿瘤细胞来自于哪个细分上皮细胞呢?

    是这里面的提到的 AT1和AT2 cells ,club和ciliated细胞 吗?
    恶性肿瘤细胞来自于哪个细分上皮细胞
    而且,更进一步, 上皮细胞的恶化有清晰路径吗?这些不同上皮细胞亚群有很清晰的发育先后路径吗?
    而且,关联这些上皮细胞的降维聚类分群结果,跟前面的inferCNV结果,可以看到,我们的 AT1和AT2 cells 是比较清晰的正常上皮细胞,大概率是没有恶性的,但是 basal这个细胞很大概率上已经是恶性了。
     basal这个细胞很大概率上已经是恶性了
    也可以看具体的细胞数量情况:

    1 2 3 4 5 6
    AT1 0 127 0 0 14 6
    AT2 0 55 0 0 355 37
    Basal 54 40 17 433 123 105
    ciliated 0 102 0 0 282 1
    tumor 880 1124 234 189 376 676
    

    因为 前面的inferCNV结果里面的 2和5 是正常二倍体细胞,所以,我们的分析顺序弄错了,应该是先根据inferCNV结果挑选出来2和5的亚群,或者说正常二倍体亚群,然后进行降维聚类分群去区分上皮细胞亚群。
    也就是说如下所示的拷贝数变异全景图里面的 细胞:
    拷贝数变异全景图

    上皮细胞其实可以更进一步

    文章:《Pre-activated antiviral innate immunity in the upper airways controls early SARS-CoV-2 infection in children》就可以看到更多上皮细胞亚群:
    更多上皮细胞亚群
    除了前面的 AT1和AT2 cells ,club和ciliated细胞 , 还有 Goblet和Squamouse以及 lonocyte细胞。
    另外,文章:《Resolving the Spatial and Cellular Architecture of Lung Adenocarcinoma by Multiregion Single-Cell Sequencing》也提到了类似的上皮细胞细分情况:
    类似的上皮细胞细分
    这7万多个上皮细胞,也有 AT1和AT2 cells ,club和ciliated细胞,以及 lonocyte细胞,Bronchio细胞,各自有自己的高表达量基因:
    不同上皮细胞有自己的高表达量基因
    这些基因又可以复制粘贴到自己的项目里面去进行可视化啦,看看能否把上皮细胞进行文献里面的这样的细致的分群!

Comments are closed.