单细胞转录组探索CAFs的功能和空间异质性

癌相关的成纤维细胞 CAFs,具有异质性,是TME中的重要细胞成分,分泌的特定细胞因子、炎症趋化因子及其它可溶性因子能够诱导减缓细胞循环的过程,从而影响肿瘤细胞的增殖;2018年12月的NC文章:Spatially and functionally distinct subclasses of breast cancer-associated fibroblasts revealed by single cell RNA sequencing 使用成熟的单细胞转录组( Smart-seq2 )手段探索了癌相关的成纤维细胞 CAFs的功能和空间异质性。
Here, we use the highly sensitive Smart-seq2 protocol to delineate the heterogeneity of 768 CAFs isolated from the genetically engineered MMTV-PyMT mouse model of breast cancer

名词背景

  • single cell RNA sequencing
  • Cancer-associated fibroblasts (CAFs) / tumor-supportive CAF
  • extracellular matrix (ECM)
  • epithelial-to-mesenchymal transition (EMT).
  • MMTV-PyMT mouse model
  • a negative selection fluorescence-activated cell sorting (FACS) strategy
  • the negative selection markers Epcam, Pecam1, and Ptprc
  • to isolate an EpCAM−/CD45−/CD31−/NG2− cell fraction devoid of epithelial cells, immune cells, endothelial cells, and pericytes, respectively
  • Smart-seq2 protocol
  • External RNA Controls Consortium (ERCC) spiked in
  • principal-component analysis (PCA)
  • t-distributed stochastic neighbor embedding (t-SNE)
  • single cell differentially expressed genes (SCDE)
  • reproducibility-optimized test statistic (ROTS)
  • differentially expressed genes/significantly differentially expressed (SDE)
  • log2(RPKM + 1)
  • PAM50 proliferation metagene
  • METABRIC cohort
  • The Cancer Genome Atlas (TCGA) database
  • six commonly used mesenchymal cell markers
  • endothelial cell metagene in breast tumors

    CAFs 的背景知识

    细胞来源

  • resident fibroblasts
  • bone marrow-derived mesenchymal stem cells
  • pericytes
  • malignant cells or endothelial cells
    cellular markers
  • α-smooth muscle actin (SMA)
  • fibroblast-specific protein 1 (FSP-1/S100A4)
  • fibroblast activation protein (FAP)
    这些背景知识在文章的introduction部分有介绍:
    )
    根据相应的分子标记,就可以特异性的分选CAFs进行研究:

    单细胞分群及定义

    主要分析是tSNE,然后挑选first 150 SDE genes绘制热图 - 并且进行 gene ontology (GO) 注释来确定不同组的细胞功能:

  • Population 1 vascular CAFs (vCAFs). 细胞数量最多
  • Population 2 were named matrix CAFs (mCAFs).
  • Population 3 cells were termed cycling CAFs (cCAFs). 是vCAFs过渡阶段
  • Population 4 developmental CAFs (dCAFs).
    如下:

    可以挑选一些有确切生物学意义的基因可视化它们在这些不同群细胞的表达量分布情况:

    既然很明确的分成4组,那就可以进行差异分析,挑选差异基因绘制热图:

    同样的是GO分析注释细胞亚群的功能:

    值得注意的是: cCAFs represent the proliferative segment of vCAFs 所以最后作者认为是3群细胞,如下图:

    其中:vCAF marker Nidogen-2, the mCAF marker PDGFRα, and the dCAF marker SCRG1,这个很重要,需要仔细看作者是如何分析的。
    第4群细胞也很特殊,高表达 PyMT , 说明它是肿瘤相关细胞了。

    它们3群细胞的ECM相关基因表达模式差别很明显。

    6个公共基因集

    包括:

  • EC metagene (CDH5, CXorf36, TIE1)
  • Microvasculature
  • Stroma 1
  • Stroma 2
  • ECM metagene (COL1A1, COL1A2, COL3A1)
  • Proliferation
    主要是结合TCGA这样的公共数据库:

    还有在METABRIC数据库的:

    还有在一篇文章的:

    单细胞转录组

    数据是公开的: GSE111229 代码也是有的: GitHub [www.github.com/KPLab/SCS_CAF].
    其ngs测序数据的处理方式也是在methods有详细描述,很容易follow一遍。
    首先单细胞数据需要根据一定的指标进行过滤:

    最后作者得到的表达矩阵可以直接在GEO数据库里面现在,这样没有服务器的小伙伴就可以在此基础上面走下游分析流程。

    关于metagene

    每个分组的细胞都有特定的基因集,比如作者分析的top 150的DEGs,也可以通过算法局限到一个基因,就是metagene,看看这个在临床分组的表现情况:

Comments are closed.