<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; 原始数据</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/%e5%8e%9f%e5%a7%8b%e6%95%b0%e6%8d%ae/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>SRA工具sratoolkit把原始测序数据转为fastq格式</title>
		<link>http://www.bio-info-trainee.com/338.html</link>
		<comments>http://www.bio-info-trainee.com/338.html#comments</comments>
		<pubDate>Thu, 19 Mar 2015 01:32:04 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[linux]]></category>
		<category><![CDATA[基础数据库]]></category>
		<category><![CDATA[基础软件]]></category>
		<category><![CDATA[reads]]></category>
		<category><![CDATA[shell]]></category>
		<category><![CDATA[sratoolkit]]></category>
		<category><![CDATA[原始数据]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=338</guid>
		<description><![CDATA[一，下载该软件 wget http://ftp-trace.ncbi.nlm.n &#8230; <a href="http://www.bio-info-trainee.com/338.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>一，下载该软件</p>
<p>wget http://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/current/sratoolkit.current-ubuntu64.tar.gz</p>
<p>tar xzf sratoolkit.current-centos_linux64.tar.gz</p>
<p>解压直接使用即可，里面有一大堆的软件，针对不同的测序仪，不同的数据<span id="more-338"></span></p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式448.png"><img class="alignnone size-full wp-image-339" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式448.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式448" width="600" height="277" /></a></p>
<p>我一般只用/home/jmzeng/down_software/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump</p>
<p>/home/jmzeng/down_software/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump --split-3 SRR1793917.sra</p>
<p>二：下载数据</p>
<p>首先去NCBI里面搜索并找到你想要的数据的SRA地址，然后写脚本批量下载。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式826.png"><img class="alignnone size-full wp-image-340" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式826.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式826" width="644" height="187" /></a></p>
<p>如果文献里面的SRA号，那么可以直接打开NCBI里面的搜索界面下载</p>
<p>如果文献里面是SRP号，那么该SRP会涉及到好几个SRA数据，得一个个开网站下载</p>
<p>三：用命令解压数据</p>
<p>下载之后的数据是</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1008.png"><img class="alignnone size-full wp-image-341" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1008.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式1008" width="366" height="171" /></a></p>
<p>非常简单的命令，就可以把当前文件夹下的所有sra都解压开来！</p>
<p>[shell]</p>
<p>for i in *sra<br />
do<br />
echo $i<br />
/home/jmzeng/bio-soft/sratoolkit.2.3.5-2-ubuntu64/bin/fastq-dump --split-3 $i<br />
done</p>
<p>[/shell]</p>
<p>解压的同时它也会显示每个SRA文件的数据量</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1064.png"><img class="alignnone size-full wp-image-342" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1064.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式1064" width="405" height="432" /></a></p>
<p>&nbsp;</p>
<p>四：结果文件解读</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1235.png"><img class="alignnone size-full wp-image-343" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1235.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式1235" width="417" height="486" /></a></p>
<p>可以看到，每个SRA文件都产生了两个reads，分别是左右两端测序，说明这个SRA文件是双端测序策略。</p>
<p>随便打开一个fastq文件可以看到，它的读长是300bp</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1479.png"><img class="alignnone size-full wp-image-344" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/SRA工具sratoolkit把原始测序数据转为fastq格式1479.png" alt="SRA工具sratoolkit把原始测序数据转为fastq格式1479" width="645" height="170" /></a></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/338.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
