<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; snpeff</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/snpeff/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>用snpEFF对vcf格式的突变数据进行注释</title>
		<link>http://www.bio-info-trainee.com/1594.html</link>
		<comments>http://www.bio-info-trainee.com/1594.html#comments</comments>
		<pubDate>Thu, 05 May 2016 11:29:55 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[基础数据库]]></category>
		<category><![CDATA[基础软件]]></category>
		<category><![CDATA[未分类]]></category>
		<category><![CDATA[snpeff]]></category>
		<category><![CDATA[vcf]]></category>
		<category><![CDATA[突变]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=1594</guid>
		<description><![CDATA[这个软件比较重要，尤其是对做遗传变异相关研究的，很多人做完了snp-callin &#8230; <a href="http://www.bio-info-trainee.com/1594.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>这个软件比较重要，尤其是对做遗传变异相关研究的，很多人做完了snp-calling后喜欢用ANNOVAR来进行注释，但是那个注释还是相对比较简单，只能得到该突变位点在基因的哪个区域，那个基因这样的信息，如果想了解更具体一点，就需要更加功能化的软件了，snpEFF就是其中的佼佼者，而且是java平台软件，非常容易使用！而且它的手册写的非常详细：<a href="http://snpeff.sourceforge.net/SnpEff_manual.html">http://snpeff.sourceforge.net/SnpEff_manual.html</a><span id="more-1594"></span></p>
<p>官网是：<a href="http://snpeff.sourceforge.net/">http://snpeff.sourceforge.net/</a></p>
<p>1       889455  .       G       A       .       .        ## 假设我们的vcf文件里面记录的突变是这个，那么我们可以用snpEFF进行注释，注释得到的信息非常完全！</p>
<p>信息用|符号分割，所有很容易用脚本提取需要的信息</p>
<p>ANN=A|stop_gained|HIGH|NOC2L|ENSG00000188976|transcript|ENST00000327044|protein_coding|7/19|c.706C&gt;T|p.Gln236*|756/2790|706/2250|236/749||,A|downstream_gene_variant|MODIFIER|NOC2L|ENSG00000188976|transcript|ENST00000487214|processed_transcript||n.*865C&gt;T|||||351|,A|downstream_gene_variant|MODIFIER|NOC2L|ENSG00000188976|transcript|ENST00000469563|retained_intron||n.*878C&gt;T|||||4171|,A|non_coding_exon_variant|<strong>MODIFIER</strong>|NOC2L|ENSG00000188976|transcript|ENST00000477976|retained_intron|5/17|n.2153C&gt;T||||||;LOF=(NOC2L|ENSG00000188976|6|0.17);NMD=(NOC2L|ENSG00000188976|6|0.17)</p>
<p>包括突变类型是：non_coding_exon_variant</p>
<p>突变在各种转录本上面，在每个转录本的第几个碱基呀，哪个氨基酸的改变呀，氨基酸第几位呀！</p>
<p>标准突变表示形式是：</p>
<p>突变发生在NOC2L这个基因上面，它的ensembl 数据库ID是ENSG00000188976</p>
<p>&nbsp;</p>
<p>其余的看头文件自己慢慢理解：</p>
<p>"Functional annotations: 'Allele | Annotation | Annotation_Impact | Gene_Name | Gene_ID | Feature_Type | Feature_ID | Transcript_BioType | Rank | HGVS.c | HGVS.p | cDNA.pos / cDNA.length | CDS.pos / CDS.length | AA.pos / AA.length | Distance | ERRORS / WARNINGS / INFO'</p>
<p>&nbsp;</p>
<h1><span style="color: #ff0000;">软件安装：</span></h1>
<p>选择最新版软件下载：<a href="https://sourceforge.net/projects/snpeff/files/">https://sourceforge.net/projects/snpeff/files/</a></p>
<p>wget <a href="https://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip">https://sourceforge.net/projects/snpeff/files/snpEff_latest_core.zip</a></p>
<p>因为是java软件，unzip 解压之后就可以直接使用，当然前提是你有java平台。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2016/05/1.png"><img class="alignnone size-full wp-image-1597" src="http://www.bio-info-trainee.com/wp-content/uploads/2016/05/1.png" alt="1" width="368" height="178" /></a></p>
<h1><span style="color: #ff0000;">输入数据：</span></h1>
<p>首先下载用来做注释的数据库：java -jar snpEff.jar download GRCh37.75(自己选择需要的版本)</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2016/05/11.png"><img class="alignnone size-full wp-image-1598" src="http://www.bio-info-trainee.com/wp-content/uploads/2016/05/11.png" alt="1" width="370" height="176" /></a></p>
<p>软件下载很快，但是数据库下载就需要一定时间啦，去喝杯咖啡吧。</p>
<p>然后软件本身会提供example文件，里面就是一堆各种各样的vcf数据，而且还提供了运行命令，非常简单(examples.sh) ,这些就是我们的输入数据啦！</p>
<h1><span style="color: #ff0000;">运行命令：</span></h1>
<p>运行也很简单：java -Xmx4G -jar snpEff.jar -i vcf -o vcf GRCh37.75 example.vcf &gt; example_snpeff.vcf</p>
<p>指定输入输出格式都是vcf，然后指定刚才下载的必备数据库，然后输入输出文件即可！</p>
<p>也可以调用全路径，如果你写在脚本里面的话！</p>
<blockquote><p>java -Xmx4G -jar path/to/snpEff/snpEff.jar \</p>
<p>-c path/to/snpEff/snpEff.config \</p>
<p>GRCh37.69 \</p>
<p>path/to/example.vcf &gt; example_snpeff.vcf</p></blockquote>
<p>&nbsp;</p>
<h1><span style="color: #ff0000;">结果解读：</span></h1>
<p>这个非常复杂，对结果理解了多少，就是我们对软件理解了多少。</p>
<p>具体大家看readme吧，注释信息太多了，按需索取：</p>
<ol>
<li>chromosome_number_variation</li>
<li>exon_loss_variant</li>
<li>frameshift_variant</li>
<li>stop_gained</li>
<li>stop_lost</li>
<li>start_lost</li>
<li>splice_acceptor_variant</li>
<li>splice_donor_variant</li>
<li>rare_amino_acid_variant</li>
<li>missense_variant</li>
<li>inframe_insertion</li>
<li>disruptive_inframe_insertion</li>
<li>inframe_deletion</li>
<li>disruptive_inframe_deletion</li>
<li>5_prime_UTR_truncation+exon_loss_variant</li>
<li>3_prime_UTR_truncation+exon_loss</li>
<li>splice_branch_variant</li>
<li>splice_region_variant</li>
<li>splice_branch_variant</li>
<li>stop_retained_variant</li>
<li>initiator_codon_variant</li>
<li>synonymous_variant</li>
<li>initiator_codon_variant+non_canonical_start_codon</li>
<li>stop_retained_variant</li>
<li>coding_sequence_variant</li>
<li>5_prime_UTR_variant</li>
<li>3_prime_UTR_variant</li>
<li>5_prime_UTR_premature_start_codon_gain_variant</li>
<li>upstream_gene_variant</li>
<li>downstream_gene_variant</li>
<li>TF_binding_site_variant</li>
<li>regulatory_region_variant</li>
<li>miRNA</li>
<li>custom</li>
<li>sequence_feature</li>
<li>conserved_intron_variant</li>
<li>intron_variant</li>
<li>intragenic_variant</li>
<li>conserved_intergenic_variant</li>
<li>intergenic_region</li>
<li>coding_sequence_variant</li>
<li>non_coding_exon_variant</li>
<li>nc_transcript_variant</li>
<li>gene_variant</li>
<li>chromosome</li>
</ol>
<p><a href="http://snpeff.sourceforge.net/VCFannotationformat_v1.0.pdf">http://snpeff.sourceforge.net/VCFannotationformat_v1.0.pdf</a></p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/1594.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
