<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; WES</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/wes/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>跟师妹聊Exome-seq、ChIP-seq、RNA-seq之间的差异</title>
		<link>http://www.bio-info-trainee.com/1724.html</link>
		<comments>http://www.bio-info-trainee.com/1724.html#comments</comments>
		<pubDate>Mon, 04 Jul 2016 15:50:43 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[杂谈-随笔]]></category>
		<category><![CDATA[CHIP-seq]]></category>
		<category><![CDATA[RNA-seq]]></category>
		<category><![CDATA[WES]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=1724</guid>
		<description><![CDATA[最近学习CHIP-seq的分析流程，略有点心得，也跟以前掌握的WES和RNA-s &#8230; <a href="http://www.bio-info-trainee.com/1724.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>最近学习CHIP-seq的分析流程，略有点心得，也跟以前掌握的WES和RNA-seq做了一些比较，趁跑步的时候跟师妹讨论了一下，正好师妹写了一篇博客来分享这个讨论结果，我也借此机会转载过来，分享给大家，算是借花献佛吧！师妹的博文是用markdown写作，我觉得大家应该直接看她的文章，写得条理清楚：<a href="http://shemy.site/2016/06/29/The-different-between-Exome-seq-ChIP-seq-and-RNA-seq/">Exome-seq、ChIP-seq、RNA-seq之间的差异</a><span id="more-1724"></span></p>
<article>全外显子测序是啥？转录组测序是啥？转录组测序又是啥？他们之间有什么差别么？傻傻分不清，不用怕，多学习下就会了，下面让我们一起来看看！</p>
<h3 id="section">1 温基础</h3>
<ul>
<li><strong>测序深度：</strong> 指测序得到的总碱基数与待测基因组大小的比值。假设一个基因大小为2M，测序深度为10X，如果是全基因覆盖的话，那么获得的总数据量 为20M。</li>
<li><strong>覆盖度：</strong> 指测序获得的序列占整个基因组的比例。由于基因组中的高GC、重复序列等复杂结构的存在，测序最终拼接组装 获得的序列往往无法覆盖有所的区域，这部分没有获得的区域就称为Gap。例如一个细菌基因组测序，覆盖度是98 %，那么还有2%的序列区域是没有通过测序获得的。（你想实际测到的内容占想测内容的比例。）</li>
</ul>
<h3 id="section-1">2 理概念</h3>
<ul>
<li><strong>全外显子测序（Exome-seq）：</strong> 首先外显子组（Exome）是指真核生物基因组中全部外显子区域的总和，包含了蛋白质合成最直接的信息。外显子 组测序（Exome-seq）是利用设计好的探针将坐标已知的全基因组外显子区域的DNA捕捉并富集后，进行高通量测 序的基因组分析方法。 对于人类基因组来说，外显子区域大概占到基因组的1%，大概在30M左右。一般全外显子测序的测序深度 为50X~200X，具体深度依研究目的而定，其个体之间的变异小（在VCF文件上记录着少许差异，一点点）。</li>
<li><strong>转录组测序（RNA-seq）：</strong> 首先转录组是指在相同环境（或生理条件）下的在一个细胞、或一群细胞中所能转录出的所有RNA的总和，包括信使RNA（mRNA）、核糖体RNA（rRNA）、转运RNA（tRNA）及非编码RNA。转录组测序（RNA-seq）是将提取所要研究的特定类型的RNA，将其反转录成cDNA，利用高通量测序技术获得某一物种特定组织或器官在某一状态下的几乎所有转录本序列信息。对于已知参考基因组的物种，所获得大部分序列是已知的，同时会有一些新的转录本会被检测到，几乎可以忽略；甚至处于不同状态的人，其转录组数据有所不同。因此其主要的研究点——研究随着时空的变化、组织的变化、样本的变化，转录本发生改变。</li>
<li><strong>染色质免疫共沉淀测序（ChIP-seq）：</strong> 主要用于蛋白质与DNA相互作用研究，采用特异抗体对目的蛋白进行免疫沉淀，分离与目的蛋白结合的基因组DNA片段，对其进行纯化和文库构建，再通过高通量测序的方法，在全基因组范围内寻找目的蛋白的DNA结合位点，从而获得全基因组范围内与组蛋白、转录因子等互作的DNA片段信息。（与外显子测序不一样，不是通过设计好的探针来捕获序列的，而是通过特异的RNApoly酶、组蛋白、转录因子来捕获序列的，蛋白结合在哪里就捕获哪里。每做一次实验，换一个蛋白，所捕获的序列是不一样的。）因此其主要研究点——研究用不同组蛋白、转录因子等不同蛋白来做不同的实验，找出互作的DNA序列的不同。</li>
</ul>
<h3 id="section-2">3 明差异</h3>
<ul>
<li><strong>测序范围的区别：</strong> 全外显子测序和转录组测序的测序范围是已知的，均针对基因组的转录区域进行测序，但它们有一定的差异，主要为：（1）使用范围有所不同。外显子组测序只能对已知基因组序列信息的物种进行测序，而转录组测序没有这样的限制。转录组可以对Non-coding RNA等进行测序，而外显子组测序仅限于外显子区域；（2）转录组可以反映特定时刻、特定组织该物种的基因表达情况，而外显子组测序不具备此能力。但是，因为部分基因低表达或组织特异表达，转录组难以获得物种全部外显子的信息，而外显子组测序不受表达情况影响，可均一地获得外显子区域序列信息；（3）从转录组获得的遗传信息可能受到转录后加工的影响而导致与基因组不符，而外显子测序无此影响。 染色质免疫共沉淀的测序范围是不确定的、未知的，研究不同蛋白质，其所捕获DNA序列区域是不同的；</li>
<li><strong>测序深度的区别：</strong> 全外显子测序的测序深度在任何一个点是均匀的；转录组测序一定是不均匀的，以外显子为单位的不均匀；染色质免疫共沉淀测序的测序深度也是不均匀的，以每个碱基为单位的不均匀，与实验设计有关；</li>
</ul>
<h3 id="section-3">4 参考资料</h3>
<p>1 绝大部分来自健明师兄口诉；</p>
<p>2 <a href="http://mp.weixin.qq.com/s?__biz=MzA5NjA0ODgxNQ==&amp;mid=2652647044&amp;idx=1&amp;sn=4da112147545b556d81b05f61711eb91&amp;scene=1&amp;srcid=0628EH9SshJfS7HEi2R0FQlo&amp;from=singlemessage&amp;isappinstalled=0#wechat_redirect" target="_blank">【你问我答】外显子测序篇</a></p>
<p>3 <a href="http://blog.sina.com.cn/s/blog_80d2d9fd0100x4la.html" target="_blank">高通量基因组测序中，什么是测序深度和覆盖度？</a></p>
</article>
<hr />
<h2 id="similar_posts">相似文章</h2>
<ul>
<li class="relatedPost"><a href="http://shemy.site//2016/06/20/So-you-want-to-be-a-computational-biologist/">你想成为计算生物学家么？</a></li>
<li class="relatedPost"><a href="http://shemy.site//2016/06/18/Bioinformatics-exercise-1/">【每日一生信】用perl统计碱基计数及GC含量</a></li>
<li class="relatedPost"><a href="http://shemy.site//2016/06/02/How-to-learn/">我的生信学习总结反思</a></li>
<li class="relatedPost"><a href="http://shemy.site//2016/05/31/The-Development-of-Bioinformatics/">基因行业探索</a></li>
</ul>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/1724.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>WES（一）测序质量控制</title>
		<link>http://www.bio-info-trainee.com/1108.html</link>
		<comments>http://www.bio-info-trainee.com/1108.html#comments</comments>
		<pubDate>Sun, 01 Nov 2015 09:58:13 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[全外显子组软件]]></category>
		<category><![CDATA[QC]]></category>
		<category><![CDATA[WES]]></category>
		<category><![CDATA[测序质量控制]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=1108</guid>
		<description><![CDATA[这一步主要看看这些外显子测序数据的测序质量如何： 首先用fastqc处理，会出一 &#8230; <a href="http://www.bio-info-trainee.com/1108.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>这一步主要看看这些外显子测序数据的测序质量如何：</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/11/image0011.png"><img class="alignnone size-full wp-image-1109" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/11/image0011.png" alt="image001" width="505" height="126" /></a><span id="more-1108"></span></p>
<p>首先用fastqc处理，会出一些图表，肯定是没问题的啦，如果数据有问题，公司就不会给你，那样不砸了他们自己的招牌嘛。</p>
<p>然后我们粗略统计下平均测序深度及目标区域覆盖度，这个是重点，不过一般没问题的，因为现在芯片捕获技术非常成熟了，而且实验水平大幅提升，没有以前那么多的问题了。</p>
<p>这个外显子项目的测序文件里面，mpileup文件是1371416525行，意味着总的测序长度是1.3G，以前我接触的一般是600M左右的<br />
因为外显子目标区域并不大，就34729283bp，也就是约35M。</p>
<p>即使加上侧翼长度</p>
<p>54692160 外显子加上前后50bp</p>
<p>73066288  外显子加上前后100bp</p>
<p>90362533  外显子加上前后150bp</p>
<p>然后我要根据外显子记录文件对mpileup文件进行计数，统计外显子coverage，还有测序深度，这个脚本其实蛮有难度的！</p>
<p>&nbsp;</p>
<p>我前面提到过外显子组的序列仅占全基因组序列的1%左右，而我在NCBI里面拿到 consensus coding sequence (CCDS)记录CCDS.20150512.txt文件，是基于hg38版本的，需要首先转换成hg19才可以来计算这次测序项目的覆盖度和平均测序深度。</p>
<p>参考：<a href="http://www.bio-info-trainee.com/?p=990">http://www.bio-info-trainee.com/?p=990</a> （ liftover基因组版本之间的coordinate转换）</p>
<p><strong> awk '{print "chr"$3,$4,$5,$1,0,$2,$4,$5,"255,0,0"}' CCDS.20150512.exon.txt &gt;CCDS.20150512.exon.hg38.bed</strong></p>
<p><strong>~/bio-soft/liftover/liftOver CCDS.20150512.exon.hg38.bed ~/bio-soft/liftover/hg38ToHg19.over.chain CCDS.20150512.exon.hg19.bed unmap</strong></p>
<p>下面这个程序就是读取转换好的外显子记录的数据，对一家三口一起统计，然后再读取每个样本的20G左右的mpileup文件，进行统计，所以很耗费时间。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/11/image0021.png"><img class="alignnone size-full wp-image-1110" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/11/image0021.png" alt="image002" width="656" height="582" /></a></p>
<p>外显子目标区域平均测序深度接近100X，所以很明显是非常好的捕获效率啦！而全基因组背景深度才3.3，这 符合实验原理, 即与探针杂交碱基多的片段比少的片段更易被捕获. 对非特异杂交的,基因组覆盖度非特异的背景 DNA 也进行了测序。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/11/image0031.png"><img class="alignnone size-full wp-image-1111" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/11/image0031.png" alt="image003" width="471" height="339" /></a></p>
<p>接下来对测序深度进行简单统计，脚本如下，但是这个图没多大意思。因为我们的外显子的35M区域平均都接近100X的测序量</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/11/image0041.png"><img class="alignnone size-full wp-image-1112" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/11/image0041.png" alt="image004" width="511" height="300" /></a></p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/1108.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
