<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; star</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/star/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>RNA-seq的比对软件star说明书</title>
		<link>http://www.bio-info-trainee.com/727.html</link>
		<comments>http://www.bio-info-trainee.com/727.html#comments</comments>
		<pubDate>Sun, 10 May 2015 14:42:11 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[生信组学技术]]></category>
		<category><![CDATA[转录组软件]]></category>
		<category><![CDATA[RNA-seq]]></category>
		<category><![CDATA[star]]></category>
		<category><![CDATA[tophat]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=727</guid>
		<description><![CDATA[类似于tophat的软件 首先当然是下载软件啦！ 两个地方可以下载，一个是谷歌c &#8230; <a href="http://www.bio-info-trainee.com/727.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<h3>类似于tophat的软件<br />
<b></b></h3>
<p>首先当然是下载软件啦！</p>
<p>两个地方可以下载，一个是谷歌code中心，被墙啦，另一个是github，我的最爱。</p>
<p>wget <a href="https://codeload.github.com/alexdobin/STAR/zip/master">https://codeload.github.com/alexdobin/STAR/zip/master</a></p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/2013-RNA-seq的star-类似于tophat的软件说明书217.png"><img class="alignnone size-full wp-image-728" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/2013-RNA-seq的star-类似于tophat的软件说明书217.png" alt="2013-RNA-seq的star-类似于tophat的软件说明书217" width="366" height="195" /></a></p>
<p>解压即可使用啦，其中程序在bin目录下面，根据自己的平台调用即可！</p>
<p>然后doc里面还有个pdf的说明文档，写的非常清楚，我也是看着那个文档学的这个软件！</p>
<p>接下来就是准备数据啦！</p>
<p>既然是类似于tophat一样的比对软件，当然是准备参考基因组和测序数据咯，毫无悬念。</p>
<p>然后 该软件也给出了一些测试数据</p>
<p><a href="ftp://ftp2.cshl.edu/gingeraslab/tracks/STARrelease/2.1.4/">ftp://ftp2.cshl.edu/gingeraslab/tracks/STARrelease/2.1.4/</a></p>
<p>然后就是运行程序的命令！</p>
<p>分为两个步骤：首先构建索引，然后比对即可，中间的参数根据具体需要可以细调！</p>
<p>构建索引时候，软件说明书给的例子是</p>
<p>The basic options to generate genome indices are as follows:<br />
--runThreadN <i>NumberOfThreads</i><br />
--runMode genomeGenerate<br />
--genomeDir <i>/path/to/genomeDir</i><br />
--genomeFastaFiles <i>/path/to/genome/fasta1 /path/to/genome/fasta2 ...</i><br />
--sjdbGTFfile <i>/path/to/annotations.gtf</i><br />
--sjdbOverhang <i>ReadLength-1</i></p>
<p>我模仿了一下。对我从ensembl ftp里面下载的老鼠基因组构建了索引</p>
<p>/home/jmzeng/hoston/RNA-soft/STAR-master/bin/Linux_x86_64/STAR  \</p>
<p>--runThreadN 30 #我的服务器还比较大，可以使用30个CPU  \</p>
<p>--runMode genomeGenerate \</p>
<p>--genomeDir  /home/jmzeng/hoston/mouse/STAR-mouse #构建好的索引放在这个目录 \</p>
<p>--genomeFastaFiles  /home/jmzeng/hoston/mouse/Mus_musculus.GRCm38.fa.fa \</p>
<p>--sjdbGTFfile /home/jmzeng/hoston/mouse/Mus_musculus.GRCm38.79.gtf \</p>
<p>--sjdbOverhang 284   #我的测序数据长短不一，最长的是285bp</p>
<p>当然注释的地方你要删除掉才行呀，因为cpu用的比较多。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/2013-RNA-seq的star-类似于tophat的软件说明书1302.png"><img class="alignnone size-full wp-image-729" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/2013-RNA-seq的star-类似于tophat的软件说明书1302.png" alt="2013-RNA-seq的star-类似于tophat的软件说明书1302" width="554" height="467" /></a></p>
<p>算一算时间，对4.6G的小鼠基因组来说，半个小时算是非常快的了！Bowtie2的index要搞两个多小时。</p>
<p>然后就是比对咯。这也是很简单的，软件说明书给的例子是</p>
<p>The basic options to run a mapping job are as follows:<br />
--runThreadN <i>NumberOfThreads</i><br />
--genomeDir <i>/path/to/genomeDir</i><br />
--readFilesIn <i>/path/to/read1 </i>[<i>/path/to/read2</i>]</p>
<p>我稍微理解了一下参数，然后写出了自己的命令。</p>
<p>fq=740WT1.fq.trimmed.single</p>
<p>mkdir  740WT1_star</p>
<p>/home/jmzeng/hoston/RNA-soft/STAR-master/bin/Linux_x86_64/STAR  \</p>
<p>--runThreadN 20  \</p>
<p>--genomeDir  /home/jmzeng/hoston/mouse/STAR-mouse   \</p>
<p>--readFilesIn  $fq \</p>
<p>--outFileNamePrefix  ./740WT1_star/740WT1</p>
<p>如果输出文件需要被cufflinks套装软件继续使用。就需要用一下参数</p>
<p>Cufflinks/Cuffdiff require spliced alignments with XS strand attribute, which STAR will generate with --outSAMstrandField intronMotif option.</p>
<p>还有--outSAMtype参数可以修改输出比对文件格式，可以是sam也可以是bam，可以是sort好的，也可以是不sort的。</p>
<p>最后是输出文件解读咯！</p>
<p>其实没什么好解读的，输出反正就是sam类似的比对文件咯，如果还有其它文件，需要自己好好解读说明书啦。我就不废话了！</p>
<p>&nbsp;</p>
<p>值得一提的是，该程序提供了2次map的建议</p>
<p>The basic idea is to run 1st pass of STAR mapping with the usual parameters , then collect the junctions detected in the first pass, and use them as ”annotated” junctions for the 2nd pass mapping.</p>
<p>在对RNA-seq做snp-calling的时候可以用到，尤其是GATK官方还给出了教程，大家可以好好学习学习！</p>
<p><a href="http://www.broadinstitute.org/gatk/guide/article?id=3891">http://www.broadinstitute.org/gatk/guide/article?id=3891</a></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/727.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
