<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; 纯和率</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/%e7%ba%af%e5%92%8c%e7%8e%87/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>根据X染色体的snp的纯和率来判断性别</title>
		<link>http://www.bio-info-trainee.com/1243.html</link>
		<comments>http://www.bio-info-trainee.com/1243.html#comments</comments>
		<pubDate>Tue, 22 Dec 2015 13:28:53 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[生信基础]]></category>
		<category><![CDATA[性别]]></category>
		<category><![CDATA[纯和率]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=1243</guid>
		<description><![CDATA[针对高通量测序数据，包括WGS，WES，甚至snp6芯片也行。 我这里主要讲根据 &#8230; <a href="http://www.bio-info-trainee.com/1243.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<div><span style="font-family: KaiTi_GB2312;">针对高通量测序数据，包括WGS，WES，甚至snp6芯片也行。</span></div>
<div><span style="font-family: KaiTi_GB2312;">我这里主要讲根据vcf文件里面的chrX的纯合率来判断性别，大家可以自己处理数据得到vcf文件！</span></div>
<div><span style="font-family: KaiTi_GB2312;">主要是读取vcf文件，选择chrX上面的记录，统计genotype即可：</span></div>
<div><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/12/clipboard.png"><img class="alignnone size-full wp-image-1245" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/12/clipboard.png" alt="clipboard" width="726" height="266" /></a></div>
<div>我这里拿之前的自闭症项目数据来举例子：</div>
<div><strong>根据数据提供者的信息，3-4-5分别就是孩子、父亲、母亲</strong>，统计chrX的snp的的纯合和杂合的比例，代码很简单</div>
<div>vcf文件一般第一列是染色体，第6列是质量，第10列是基因型已经测序深度相关信息</div>
<p><span style="font-family: Arial;">cat Sample5.gatk.UG.vcf |perl -alne '{next unless $F[0] eq "chrX";next unless $F[5]&gt;30;$h{(split/:/,$F[9])[0]}++}END{print "$_\t$h{$_}" foreach keys %h}' </span></p>
<div><span style="font-family: Arial;"><b>如果纯合的snp是杂合的倍数超过一定阈值，比如4倍，就可以判断是男性。</b><br />
</span></p>
<div><span style="font-family: Arial;">对于Sample3来说，很明显，是男孩，因为X染色体都是纯合突变<br />
</span></p>
<div><span style="font-family: Arial;">0/1 391<br />
1/1 2463<br />
2/2 1<br />
1/2 32<br />
0/2 1<br />
对于Sample4来说，很明显，应该是母亲，<strong>证明之前别人给我的信息有误</strong><br />
1/1 3559<br />
1/2 27<br />
0/1 1835<br />
0/2 5<br />
那么Sample5很明显就是父亲咯<br />
1/1 2626<br />
0/1 356<br />
1/2 22</span></div>
</div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/1243.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
