外显子测序流程-文章里面的

就是做一个图床而已,需要这个图片的网页url链接,没别的意思!

wes-data-analysis-workflow

一、质控(fastqc +tookit)

1数据质量:

1)碱基质量分布

2)reads质量分布

3)reads长度分布

4)GC含量

 

2数据过滤

1)原始reads数

2)平均质量值>Q20 reads数目和比例

3)平均质量值>Q30 reads数目和比例

4)过滤掉reads中碱基质量<Q20的碱基占比超过5%的reads。统计clean data的reads和比例。

 

二、比对(bwa)

1)比对上基因组的reads数及占总数的比例

2)完全匹配的reads数

3)匹配上各个染色体的reads数

4)染色体上的覆盖深度

5)落在目标区域(exon)的reads数

6)落在目标区域+-100的reads数

7)目标区域碱基覆盖深度

8)目标区域碱基被覆盖比例

9)目标区域碱基被覆盖(50X,100X,150X,200X。。。)的比例

 

三、find SNV(samtools +picard+gatk+varscan)

1)picard :sam >sort.bam

2)gatk :sort.bam >sort.dedup.bam (去重复)

3)gatk :sort.dedup.bam > realign.bam (重新比对,indel和snp校正)

4)Gatk :碱基质量重打分。(未进行)

5)Varscan :call SNV

 

 

四、突变注释

1)annovar注释。

2)注释结果统计(同义,非同义突变,基因上下游,内含子,外显子上。。等)

3)dbsnp 注释(找到的snp是否在dbsnp数据库上)

4) cosmic63 :癌症相关突变

 

五、突变分析

1)snv在个染色体上的分布

2)各基因上snv的分布

3)Snv位点较多的基因进行功能分析(pathway,kegg的通路分析和Go功能富集)

 

Comments are closed.