<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; reads</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/reads/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>根据X,Y染色体比对上的reads数来判断性别</title>
		<link>http://www.bio-info-trainee.com/1244.html</link>
		<comments>http://www.bio-info-trainee.com/1244.html#comments</comments>
		<pubDate>Tue, 22 Dec 2015 13:32:13 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[生信基础]]></category>
		<category><![CDATA[reads]]></category>
		<category><![CDATA[性别]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=1244</guid>
		<description><![CDATA[针对高通量测序数据，包括WGS，WES 我这里主要讲根据bam文件里面的chrX &#8230; <a href="http://www.bio-info-trainee.com/1244.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<div>
<div>
<div>
<div>
<div>针对高通量测序数据，包括WGS，WES</div>
<div>我这里主要讲根据bam文件里面的chrX和chrY的reas比例来判断性别，大家可以自己处理数据得到bam文件！</div>
<div>主要是读取bam文件，选择chrX上面的记录，统计genotype即可：</div>
</div>
<div><span style="font-family: KaiTi_GB2312;">也可以统计测序深度，samtools  depth $i |grep 'chr[XY]'</span></div>
<div><span style="font-family: KaiTi_GB2312;"><b>如果chrX和chrY的reads比例超过一定值，比如50倍，就判定为女性！</b></span></div>
<div>脚本很简单，就统计bam文件的第三列就可以啦，第三列就是染色体信息</div>
<div> samtools  view $i |  perl -alne '{$h{$F[2]}++}END{print "$_\t$h{$_}" foreach sort keys %h}' &gt;$out.chromosome.stat</div>
<div></div>
</div>
</div>
</div>
<div><span style="font-family: Arial;">对于Sample3，<br />
</span></div>
<div><span style="font-family: Arial;">chrX 1233061</span></div>
<div><span style="font-family: Arial;">chrY 140506</span></div>
<div><span style="font-family: Arial;"> </span></div>
<div><span style="font-family: Arial;">对于Sample4，很明显，这个是女性！<br />
</span></div>
<div><span style="font-family: Arial;">chrX 2734815</span></div>
<div><span style="font-family: Arial;">chrY 51860</span></div>
<div><span style="font-family: Arial;"> </span></div>
<div><span style="font-family: Arial;">对于Sample5</span></div>
<div><span style="font-family: Arial;">chrX 1329302</span></div>
<div><span style="font-family: Arial;">chrY 156663</span></div>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/1244.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>SRA工具sratoolkit把原始测序数据转为fastq格式</title>
		<link>http://www.bio-info-trainee.com/338.html</link>
		<comments>http://www.bio-info-trainee.com/338.html#comments</comments>
		<pubDate>Thu, 19 Mar 2015 01:32:04 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[linux]]></category>
		<category><![CDATA[基础数据库]]></category>
		<category><![CDATA[基础软件]]></category>
		<category><![CDATA[reads]]></category>
		<category><![CDATA[shell]]></category>
		<category><![CDATA[sratoolkit]]></category>
		<category><![CDATA[原始数据]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=338</guid>
		<description><![CDATA[一，下载该软件 wget http://ftp-trace.ncbi.nlm.n &#8230; <a href="http://www.bio-info-trainee.com/338.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>一，下载该软件</p>
<p>wget http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz</p>
<p>tar xzf sratoolkit.current-centos_linux64.tar.gz</p>
<p>解压直接使用即可，里面有一大堆的软件，针对不同的测序仪，不同的数据<span id="more-338"></span></p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式448.png"><img class="alignnone size-full wp-image-339" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式448.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式448" width="600" height="277" /></a></p>
<p>我一般只用/home/jmzeng/down_software/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump</p>
<p>/home/jmzeng/down_software/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump --split-3 SRR1793917.sra</p>
<p>二：下载数据</p>
<p>首先去NCBI里面搜索并找到你想要的数据的SRA地址，然后写脚本批量下载。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式826.png"><img class="alignnone size-full wp-image-340" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式826.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式826" width="644" height="187" /></a></p>
<p>如果文献里面的SRA号，那么可以直接打开NCBI里面的搜索界面下载</p>
<p>如果文献里面是SRP号，那么该SRP会涉及到好几个SRA数据，得一个个开网站下载</p>
<p>三：用命令解压数据</p>
<p>下载之后的数据是</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1008.png"><img class="alignnone size-full wp-image-341" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1008.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式1008" width="366" height="171" /></a></p>
<p>非常简单的命令，就可以把当前文件夹下的所有sra都解压开来！</p>
<p>[shell]</p>
<p>for i in *sra<br />
do<br />
echo $i<br />
/home/jmzeng/bio-soft/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump --split-3 $i<br />
done</p>
<p>[/shell]</p>
<p>解压的同时它也会显示每个SRA文件的数据量</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1064.png"><img class="alignnone size-full wp-image-342" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1064.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式1064" width="405" height="432" /></a></p>
<p>&nbsp;</p>
<p>四：结果文件解读</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1235.png"><img class="alignnone size-full wp-image-343" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1235.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式1235" width="417" height="486" /></a></p>
<p>可以看到，每个SRA文件都产生了两个reads，分别是左右两端测序，说明这个SRA文件是双端测序策略。</p>
<p>随便打开一个fastq文件可以看到，它的读长是300bp</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1479.png"><img class="alignnone size-full wp-image-344" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1479.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式1479" width="645" height="170" /></a></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/338.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
