25

单细胞级别的ChIP-seq和传统bulk数据分析流程差异大吗

很早以前我就在《生信技能树》的推文:新的ngs流程该如何学习(以CUT&Tag 数据处理为例子),提到了我自己是不太可能去把所有的ngs流程全部录制视频的,只能说是更好的传达学习方法给到大家。

其实如果你看过我表观组学系列,比如《ChIP-seq数据分析》《ATAC-seq数据分析》 就会知道这些技术都可以被单细胞化, 如果你具备比较好的背景知识,理论上是可以自己根据文档把它们对应的单细胞水平的数据分析摸索成功。那就作为学徒作业吧,摸索scChIPseq流程!

文章是:High-throughput single-cell ChIP-seq identifies heterogeneity of chromatin states in breast cancer. Nat Genet 2019 Jun;51(6):1060-1066. PMID: 31152164

数据在:https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE117309

GSM3290887 H3K4me3_scChIPseq_Jurkat-Ramos
GSM3290888 H3K27me3_scChIPseq_Jurkat-Ramos

GSM3290889 H3K27me3_scChIPseq_HBCx-95
GSM3290890 H3K27me3_scChIPseq_HBCx-95-CapaR
GSM3290891 H3K27me3_scChIPseq_HBCx-22
GSM3290892 H3K27me3_scChIPseq_HBCx-22-TamR

# 下面的4个单细胞都是10x技术的 
GSM3290893 H3K27me3_scRNAseq_HBCx-95
GSM3290894 H3K27me3_scRNAseq_HBCx-95-CapaR
GSM3290895 H3K27me3_scRNAseq_HBCx-22
GSM3290896 H3K27me3_scRNAseq_HBCx-22-TamR

可以看到,区分T和B细胞亚群的效果非常好!

image-20210414185154532

两种组蛋白修饰情况:

  • H3K4me3: n = 1,736 T cells and 839 B cells;
  • H3K27me3: n = 1,481 T cells and 1,643 B cells

这两个两种组蛋白修饰的生物学意义完全不一样哦:

image-20210414193246028

数据分析方面也是拿到矩阵,主要是Bowtie v.1.2.2比对到mm10和 hg38两个 参考基因组,去除PCR重复,:

  • We generated a coverage matrix and metrics from these de-duplicated reads, referred to as ‘unique reads’ in the text.
  • For each cell, reads were binned in non-overlapping 50 kb bins for H3K27me3, known to accumulate over broad genomic regions, and 5 kb genomic bins for H3K4me3,
  • known to accumulate in narrow peaks around TSSs, spanning the genome, to generate an n X m coverage matrix with n barcodes and m genomic bins.

如果你没有单细胞转录组认知,需要先看看基础10讲:

最基础的往往是降维聚类分群,参考前面的例子:人人都能学会的单细胞聚类分群注释

25

2020也不差-单细胞天地编辑团队全体成员有话说

在周运来的提议下,我们开启了一个颇有仪式感的元旦寄语活动,所以大家在2021年的1月1号的0点看到了这封由单细胞天地编辑团队全体成员“拼凑”出来的信,蓦然回首,发现在这个已经是去了的几乎每天都是在“见证历史”的2020,咱们其实也不差,该发文章的发文 Continue reading

25

带着文件夹结构的拷贝

最近接了一个单细胞转录组项目,有80个10X样品,每个样品的单细胞测序数据都是100G左右的fq.gz文件,很不容易跑完了全部的cellranger流程,发现了一个很有意思的事情,每个样品的输出文件都很很复杂。这个时候我需要把各自样品的html文件拷贝并且改名后先给客户开卡,如下所示的结构: Continue reading

25

对单细胞表达矩阵做gsea分析

gsea分析这方面教程我在《生信技能树》公众号写了不少了,不管是芯片还是测序的表达矩阵,都是一样的,把基因排序即可。那在单细胞分析里面也是如此,首先对指定的单细胞亚群可以做差异分析,然后就有了基因排序,后面gsea分析全部的代码无需修改,我这里演示一个简单的例子给大家哈! Continue reading