<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; DynamicTrim</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/dynamictrim/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>solexaQA 对测序数据进行简单过滤</title>
		<link>http://www.bio-info-trainee.com/454.html</link>
		<comments>http://www.bio-info-trainee.com/454.html#comments</comments>
		<pubDate>Tue, 24 Mar 2015 09:29:52 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[基础软件]]></category>
		<category><![CDATA[DynamicTrim]]></category>
		<category><![CDATA[LengthSort]]></category>
		<category><![CDATA[数据]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=454</guid>
		<description><![CDATA[一．下载该软件 http://solexaqa.sourceforge.net/ &#8230; <a href="http://www.bio-info-trainee.com/454.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>一．下载该软件</p>
<p><a href="http://solexaqa.sourceforge.net/index.htm">http://solexaqa.sourceforge.net/index.htm</a></p>
<p>下载解压开</p>
<p>现在已经把它的三个功能整合到一起啦</p>
<p>之前是分开的程序，我主要用它的两个perl 程序，我比较喜欢之前的版本，所以下面的讲解也是基于这两个perl程序。</p>
<p>这两</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤295.png"><img class="alignnone size-full wp-image-455" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤295.png" alt="solexaQA 对测序数据进行简单过滤295" width="295" height="214" /></a></p>
<p>个主要是对reads进行最大子串的截取</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤476.png"><img class="alignnone size-full wp-image-456" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤476.png" alt="solexaQA 对测序数据进行简单过滤476" width="639" height="169" /></a></p>
<p>&nbsp;</p>
<p>二．准备数据。</p>
<p>就是我们测序得到的原始数据。</p>
<p>第一个就是质量控制，一般是以20为标准，当然你也可以自己设定，该软件质控的原理如下：</p>
<p>使用默认的参数值(defaults to P = 0.05, or equivalently, Q = 13)</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤846.png"><img class="alignnone size-full wp-image-465" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤846.png" alt="solexaQA 对测序数据进行简单过滤846" width="554" height="650" /></a></p>
<p>&nbsp;</p>
<p>基本上就是取符合阈值的最大子串。</p>
<p>二：命令使用很简单一般使用DynamicTrim与LengthSort.pl就可以了</p>
<p>for id in *fastq</p>
<p>do</p>
<p>echo $id</p>
<p>perl DynamicTrim.pl -454 $id</p>
<p>done</p>
<p>for id in *trimmed</p>
<p>do</p>
<p>echo $id</p>
<p>perl LengthSort.pl $id</p>
<p>done</p>
<p>首先使用DynamicTrim.pl程序，非常耗时间</p>
<p>几个小时完毕之后</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤2335.png"><img class="alignnone size-full wp-image-462" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤2335.png" alt="solexaQA 对测序数据进行简单过滤2335" width="553" height="232" /></a></p>
<p>查看，产出文件如下</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤2497.png"><img class="alignnone size-full wp-image-463" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤2497.png" alt="solexaQA 对测序数据进行简单过滤2497" width="369" height="140" /></a></p>
<p>&nbsp;</p>
<p>可以看到丢弃的不多，也就三五百M的</p>
<p>简单查看丢弃的，都是短的。</p>
<p>perl -lne '{print length if $.%4==2}' SRR1793918.fastq.trimmed.discard |head</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤2678.png"><img class="alignnone size-full wp-image-464" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/solexaQA-对测序数据进行简单过滤2678.png" alt="solexaQA 对测序数据进行简单过滤2678" width="591" height="155" /></a></p>
<p>用这个脚本查看，可知好像都是短于25个碱基的被舍弃掉了，这个参数可以调整的。</p>
<p>接下来就可以用这些数据进行数据分析了</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/454.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
