<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; 基础知识</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/%e5%9f%ba%e7%a1%80%e7%9f%a5%e8%af%86/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>转载-VCF格式详解</title>
		<link>http://www.bio-info-trainee.com/863.html</link>
		<comments>http://www.bio-info-trainee.com/863.html#comments</comments>
		<pubDate>Fri, 17 Jul 2015 03:16:57 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[生信基础]]></category>
		<category><![CDATA[vcf]]></category>
		<category><![CDATA[基础知识]]></category>
		<category><![CDATA[转载]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=863</guid>
		<description><![CDATA[CHROM(chromosome):染色体 POS - position:参考基 &#8230; <a href="http://www.bio-info-trainee.com/863.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p><strong>CHROM(</strong><strong>chromosome</strong><strong>):</strong>染色体</p>
<p><strong>POS - position:</strong>参考基因组variant碱基位置，如果是INDEL（插入缺失），位置是INDEL的第一个碱基位置</p>
<p><strong>ID - identifier: </strong>variant的ID。比如在dbSNP中有该SNP的id，则会在此行给出；若没有，则用’.'表示其为一个novel variant。</p>
<p><strong>REF - reference base(s):</strong>参考碱基，染色体上面的碱基，必须是ATCGN中的一个，N表示不确定碱基</p>
<p><strong>ALT - alternate base(s):</strong>与参考序列比较发生突变的碱基</p>
<p><strong>QUAL - quality:</strong> Phred格式(Phred_scaled)的质量值，表 示在该位点存在variant的可能性；该值越高，则variant的可能性越大；计算方法：Phred值 = -10 * log (1-p) p为variant存在的概率; 通过计算公式可以看出值为10的表示错误概率为0.1，该位点为variant的概率为90%。</p>
<p><strong>FILTER - _filter status:</strong> 使用上一个QUAL值来进行过滤的话，是不够的。GATK能使用其它的方法来进行过滤，过滤结果中通过则该值为”PASS”;若variant不可靠，则该项不为”PASS”或”.”。</p>
<p><strong>INFO - additional information:</strong>  这一行是variant的详细信息，具体如下：</p>
<p><strong>DP-</strong>read depth：样本在这个位置的reads覆盖度。是一些reads被过滤掉后的覆盖度。          DP4:高质量测序碱基，位于REF或者ALT前后</p>
<p><strong>MQ</strong>：表示覆盖序列质量的均方值RMS Mapping Quality</p>
<p><strong>FQ</strong><strong>：</strong>phred值关于所有样本相似的可能性</p>
<p><strong>AF1</strong><strong>：</strong> AF(Allele Frequency) 表示Allele的频率，AF1为第一个ALT allele 发生频率的可能性评估</p>
<p><strong>AC1</strong><strong>：</strong>AC表示Allele（等位基因）的数目,AC1为对第一个ALT allele count的最大可能性评估</p>
<p><strong>AN</strong>：AN(Allele Number) 表示Allele的总数目</p>
<p><strong>IS</strong><strong>：</strong>插入缺失或部分插入缺失的reads允许的最大数量</p>
<p><strong>AC</strong><strong>：</strong>AC(Allele Count) 表示该Allele的数目</p>
<p><strong>G3</strong><strong>：</strong>ML 评估基因型出现的频率</p>
<p><strong>HWE</strong>：chi^2基于HWE的测试p值和G3</p>
<p><strong>CLR</strong><strong>：</strong>在受到或者不受限制的情况下基因型出现可能性log值</p>
<p><strong>UGT</strong>：最可能不受限制的三种基因型结构</p>
<p><strong>CGT</strong>：最可能受限制三种基因型的结构</p>
<p><strong>PV4</strong><strong>：</strong>四种P值得误差，分别是（strand、baseQ、mapQ、tail distance bias）</p>
<p><strong>INDEL</strong>：表示该位置的变异是插入缺失</p>
<p><strong>PC2</strong><strong>：</strong>非参考等位基因的phred（变异的可能性）值在两个分组中大小不同</p>
<p><strong>PCHI2</strong><strong>：</strong>后加权chi^2，根据p值来测试两组样本之间的联系</p>
<p><strong>QCHI2</strong>：Phred scaled PCHI2.</p>
<p><strong>PR</strong><strong>：</strong>置换产生的一个较小的PCHI2</p>
<p><strong>QBD</strong>：Quality by Depth，测序深度对质量的影响</p>
<p><strong>RPB</strong><strong>：</strong>序列的误差位置（Read Position Bias）</p>
<p><strong>MDV</strong>：样本中高质量非参考序列的最大数目</p>
<p><strong>VDB</strong>：Variant Distance Bias，RNA序列中过滤人工拼接序列的变异误差范围</p>
<p><strong>GT</strong><strong>：</strong>样品的基因型（genotype）。两个数字中间用’/'分 开，这两个数字表示双倍体的sample的基因型。0 表示样品中有ref的allele； 1 表示样品中variant的allele； 2表示有第二个variant的allele。因此： 0/0 表示sample中该位点为纯合的，和ref一致； 0/1 表示sample中该位点为杂合的，有ref和variant两个基因型； 1/1 表示sample中该位点为纯合的，和variant一致。</p>
<p><strong>GQ</strong><strong>：</strong>基因型的质量值(Genotype Quality)。Phred格式(Phred_scaled)的质量值，表示在该位点该基因型存在的可能性；该值越高，则Genotype的可能性越 大；计算方法：Phred值 = -10 * log (1-p) p为基因型存在的概率。</p>
<p><strong>GL</strong><strong>：</strong>三种基因型（RR RA AA）出现的可能性，R表示参考碱基，A表示变异碱基</p>
<p><strong>DV</strong><strong>：</strong>高质量的非参考碱基</p>
<p><strong>SP</strong><strong>：</strong>phred的p值误差线</p>
<p><strong>PL</strong>：指定的三种基因型的质量值(provieds the likelihoods of the given genotypes)。这三种指定的基因型为(0/0,0/1,1/1)，这三种基因型的概率总和为1。和之前不一致，该值越大，表明为该种基因型的可能 性越小。 Phred值 = -10 * log (p) p为基因型存在的概率。</p>
<p><strong>FORMAT </strong><strong>和</strong><strong> BC1-1-base.sorted.bam</strong><strong>：</strong>这两行合起来提供了’ BC1-1-base′这个sample的基因型的信息。’ BC1-1-base′代表这该名称的样品，是由BAM文件中的@RG下的 SM 标签决定的。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/863.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>转-基因突变种类大全</title>
		<link>http://www.bio-info-trainee.com/861.html</link>
		<comments>http://www.bio-info-trainee.com/861.html#comments</comments>
		<pubDate>Fri, 17 Jul 2015 03:15:44 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[生信基础]]></category>
		<category><![CDATA[基础知识]]></category>
		<category><![CDATA[转载]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=861</guid>
		<description><![CDATA[突变（Mutation, 即基因突变）:在生物学上的含义，是指细胞中的遗传基因（ &#8230; <a href="http://www.bio-info-trainee.com/861.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<h3>突变（Mutation, 即基因突变）:在生物学上的含义，是指细胞中的遗传基因（通常指存在于细胞核中的<strong>脱氧核糖核酸</strong>）发生的改变。它包括<strong>单个</strong>碱基改变所引起的<strong>点突变</strong>，或<strong>多个</strong>碱基的<strong>缺失、重复和插入</strong>。原因可以是细胞分裂时遗传基因的复制发生错误、或受化学物质、辐射或病毒的影响。</h3>
<p><strong>以功能分类</strong><strong>:</strong></p>
<p><strong>失去功能的突变</strong>Loss-of-function mutations</p>
<p><strong>：</strong><em>失去功能的突变是指发生的突变会造成</em><em>基因完全地失去活性</em><em>，原因可分成两类。一类是由于基因被删除或是调控基因表现的过程受到影响让基因不表现，另一种则是由于基因本身受到影响，使得基因的产物蛋白质失去功能。又称</em><em>剔除突变</em><em>（</em><em>null mutations</em><em>）或是</em><em>敲除突变</em><em>（</em><em>knockout mutations</em><em>）。</em></p>
<p><strong>次形态突变</strong><strong>Time form mutation</strong><strong>：</strong><em>此种突变会使基因的表现或是基因产物的</em><em>活性减弱</em><em>，但不会消失。</em></p>
<p><strong>超形态突变</strong><strong>hypermorphic mutations</strong>：<em>此种突变与次形态突变相反，会使基因的</em><em>表现加强</em><em>。</em></p>
<p><strong>获得功能的突变</strong><strong>gain-of-function mutation</strong><strong>：</strong><em>获得功能的突变是指发生的突变让</em><em>原本应该是不表现的基因产生活性</em><em>，进而影响细胞功能，这样的突变多半需要染色体程度的突变较有可能产生，而最常发生获得功能的突变就是癌细胞。</em></p>
<p><strong>以突变机理分类</strong><strong>:</strong></p>
<ol>
<li><strong>点突变</strong><strong>point mutation</strong>:<em>DNA</em><em>序列中涉及</em><em>单个核苷酸或碱基</em><em>的变化称为点突变。</em> <em>通常有两种情况：一是一种碱基或核苷酸被另一种碱基或核苷酸所</em><em>替换</em><em>；二是</em><em>一个</em><em>碱基的</em><em>插入</em><em>或</em><em>缺失。</em></li>
</ol>
<p><em>                   </em>（1）沉默突变<strong>silent mutation</strong></p>
<p><em>当点突变发生在</em><em>基因及其调控序列之外</em><em>，或使基因序列内一种密码子变成编码同一种氨基酸的另一种同义密码子时，不会改变生物个体的基因产物，因而不引起性状变异。</em><em>不引起生物性状变异</em><em>的突变称为沉默突变。</em></p>
<p><em>                   </em>（2）错义突变<strong>missense mutation</strong></p>
<p><em>指由于某个</em><em>碱基对</em><em>的改变，使编码</em><em>一种氨基酸的密码子变成编码另外一种氨基酸的密码子</em><em>，结果使构成蛋白质的数百上千个氨基酸中有一个氨基酸发生变化。（实例：</em><a href="http://baike.baidu.com/view/1257542.htm"><em>镰刀形细胞贫血症</em></a><em>）</em></p>
<p><em>                   </em>（3）移码突变<strong>frameshift mutation</strong></p>
<p><em>指在</em><em>DNA</em><em>链上，有时</em><em>一个或几个非</em><em>3</em><em>的整数倍的碱基的插入或缺失</em><em>，往往产生比碱基替换突变更严重的后果。</em> <em>这种插入或缺失突变会造成阅读框的改变，翻译过程中其下游的三联密码子都被错读，产生完全错误的肽链或肽链合成提前终止。这种插入或缺失突变又称为移码突变。</em></p>
<p><em>                   </em>（4）无义突变<strong>nonsense mutation</strong></p>
<p><em>是指当</em><em>点突变</em><em>使一个编码氨基酸的</em><em>密码子变成终止子</em><em>时，则蛋白质合成进行到该突变位点时会提前终止，结果产生一个较短的多肽链或较小的蛋白质。</em></p>
<ol start="2">
<li>大突变</li>
</ol>
<p>大突变是可能涉及整个基因以至多个基因的一长段DNA序列的改变，大突变常常导致染色体畸变。</p>
<p>（1）缺失:指DNA分子丢失一段碱基序列。（染色体缺失）(Deletion)</p>
<p>（2）插入:指DNA分子的正常序列中插入一段DNA序列。(Insertion②)</p>
<p>（3）重排:重排包括某段DNA序列的重复（duplication），倒位（inversion），易位（translocation）等。</p>
<p><em> </em></p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/861.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
