单细胞分群后继续分亚群

众所周知,单细胞水平的研究,就是为了深入了解异质性,除了可以区分已知的细胞亚型,还可以对亚型进一步细分,或者找到全新的细胞亚型。当然了,每个细胞亚型的marker基因需要一些生物学背景。
比如发表在 Nat Med. 2018 Aug; 题目是:Phenotype molding of stromal cells in the lung tumor microenvironment. 共选取5例病人的共19个样本,通过10×genomics单细胞转录组测序探索基质细胞的亚群分类、基因功能(信号通路)、关键marker基因和临床预后。共鉴定出52个基质细胞亚群,反映了肿瘤微环境复杂性。对基质细胞的marker基因做生存曲线,发现这些marker基因可以作为肺癌预后诊断的潜在标志物。
如下所示,就是先初步分群,再细分群

其实就是我一直讲解的单细胞流程,基本上学习5个R包就够用了, 而且分析流程也大同小异:
单细胞R包如过江之卿,入门的话我推荐大家学习5个R包,分别是: scater,monocle,Seurat,scran,M3Drop 需要熟练掌握它们的对象,:一些单细胞转录组R包的对象 而且分析流程也大同小异:

  • step1: 创建对象
  • step2: 质量控制
  • step3: 表达量的标准化和归一化
  • step4: 去除干扰因素(多个样本整合)
  • step5: 判断重要的基因
  • step6: 多种降维算法
  • step7: 可视化降维结果
  • step8: 多种聚类算法
  • step9: 聚类后找每个细胞亚群的标志基因
  • step10: 继续分类

    初步分群就用Seurat

    比如发表在 PNAS September 24, 2019 的文章The single-cell transcriptomic landscape of early human diabetic nephropathy ,链接 https://doi.org/10.1073/pnas.1908706116
    收集了 23,980 single-nucleus transcriptomes from 3 control and 3 early diabetic nephropathy samples. 平均每个细胞有 2,541 genes and 6,894 unique molecular ,使用Seurat就可以初步分群拿到Eleven kidney cell types和four immune cell types ,

    这些细胞类型全称如下,应该是只有专门研究这个领域的看到这些简称才不会陌生:

  • PCT, proximal convoluted tubule;
  • CFH, complement factor H;
  • LOH, loop of Henle;
  • DCT, distal convoluted tubule;
  • CT, connecting tubule;
  • CD, collecting duct;
  • PC, principal cell;
  • IC, intercalated cell;
  • PODO, podocyte;
  • ENDO, endothelium;
  • MES, mesangial cell;
  • LEUK, leukocyte.
    需要有相关生物学背景知识,才知道根据哪些marker基因来对群进行命名,这个图也是单细胞的标配:

    可以看到 LEUK, leukocyte.的 marker基因是PTPRC

    Coding sequence variants identified in PTPRC (human CD45)

    Protein tyrosine phosphatase, receptor type, C also known as PTPRC is an enzyme that, in humans, is encoded by the PTPRC gene.[5] PTPRC is also known as CD45 antigen (CD stands for cluster of differentiation), which was originally called leukocyte common antigen (LCA).[6]

    对leukocyte细分亚群

    这个就是大家比较熟悉的啦,各种免疫细胞。提取这个leukocyte的表达矩阵,继续跑Seurat流程:

    同样的,细分的亚群也是有自己的marker基因,可以看到B细胞和T细胞就很不一样。

    如果是10X仪器的单细胞转录组数据走cellranger流程,我们在单细胞天地多次分享过流程笔记:

  • 单细胞实战(一)数据下载
  • 单细胞实战(二) cell ranger使用前注意事项
  • 单细胞实战(三) Cell Ranger使用初探
  • 单细胞实战(四) Cell Ranger流程概览
  • 单细胞实战(五) 理解cellranger count的结果
    拿到表达矩阵后再走Seurat流程哦。

    最后一个思考题

    细胞分群后细胞亚群是无限划分的吗?

Comments are closed.