<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; 文库</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/%e6%96%87%e5%ba%93/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>重复序列屏蔽第二讲-用repeatscount来构建重复序列文库</title>
		<link>http://www.bio-info-trainee.com/611.html</link>
		<comments>http://www.bio-info-trainee.com/611.html#comments</comments>
		<pubDate>Thu, 02 Apr 2015 05:53:42 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[基因组学]]></category>
		<category><![CDATA[repeatscount]]></category>
		<category><![CDATA[文库]]></category>
		<category><![CDATA[重复序列]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=611</guid>
		<description><![CDATA[该软件主页 http://bix.ucsd.edu/repeatscout/ w &#8230; <a href="http://www.bio-info-trainee.com/611.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>该软件主页 <a href="http://bix.ucsd.edu/repeatscout/">http://bix.ucsd.edu/repeatscout/</a></p>
<p>wget <a href="http://bix.ucsd.edu/repeatscout/RepeatScout-1.0.5.tar.gz">http://bix.ucsd.edu/repeatscout/RepeatScout-1.0.5.tar.gz</a></p>
<p>解压进入目录，make即可</p>
<p>对于草莓这个215M的基因组来说，还是蛮快的！</p>
<p>第一步：用build_lmer_table命令把整个基因组生成一个频率表格，把所有有过重复的kmer都找出来。</p>
<p>/opt/RepeatScount/build_lmer_table -l 14 -sequence strawberry.fa -freq strawberry.freq</p>
<p>第二步：用 RepeatScout 这个命令根据生成的频率表格和基因组序列产生一个包含有所有的能找到的重复元件的文件。</p>
<p>RepeatScout -sequence strawberry.fa -freq strawberry.freq -l 14 -output strawberry_repeat</p>
<p>第三步：用filter-stage-1.prl这个脚本过滤掉低复杂度和串联重复元件。</p>
<p>&nbsp;</p>
<p>貌似得到的文件为空，难道是全部过滤掉了？？？</p>
<p>第四步：需要借用repeatmasker来把这个得到repeat文件当作文库运行生成一个out文件</p>
<p>这个软件的参数其实蛮多的，我只是简单介绍了一些，关于它参数的调试，在我网盘里面还有更具体的文档说明，就不列了！</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/611.html/feed</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
	</channel>
</rss>
