<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; 安装</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/%e5%ae%89%e8%a3%85/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>Perl及R及python模块碎碎念</title>
		<link>http://www.bio-info-trainee.com/581.html</link>
		<comments>http://www.bio-info-trainee.com/581.html#comments</comments>
		<pubDate>Wed, 01 Apr 2015 08:15:49 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[linux]]></category>
		<category><![CDATA[perl]]></category>
		<category><![CDATA[R]]></category>
		<category><![CDATA[包]]></category>
		<category><![CDATA[安装]]></category>
		<category><![CDATA[模块]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=581</guid>
		<description><![CDATA[老实说，模块其实是一个很讨厌的东西，但是它也实实在在的节省了我们很多时间，也符合 &#8230; <a href="http://www.bio-info-trainee.com/581.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>老实说，模块其实是一个很讨厌的东西，但是它也实实在在的节省了我们很多时间，也符合我的理念：避免重复造轮子！<strong>此教程可能过期了，请直接看最新版</strong>(<a href="http://www.bio-info-trainee.com/2451.html" target="_blank">perl模块安装大全</a>)</p>
<h1><b>1，perl的那些模块</b></h1>
<p>如果有root权限，用root权限</p>
<p>进入cpan然后install ExtUtils::Installed模块</p>
<p>这样就可以执行instmodsh这个脚本了，可以查看当前环境下所有的模块<span id="more-581"></span></p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念178.png"><img class="alignnone size-full wp-image-582" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念178.png" alt="Perl及R及python模块碎碎念178" width="554" height="457" /></a></p>
<p>当然也可以写出脚本来查询模块信息</p>
<p>[perl]</p>
<p>#!/usr/bin/perl</p>
<p>use strict;</p>
<p>use ExtUtils::Installed;</p>
<p>my $inst= ExtUtils::Installed-&gt;new();</p>
<p>my @modules = $inst-&gt;modules();</p>
<p>foreach(@modules)</p>
<p>{</p>
<p>my $ver = $inst-&gt;version($_) || "???";</p>
<p>printf("%-12s -- %s\n", $_, $ver);</p>
<p>}</p>
<p>exit 0;</p>
<p>[/perl]</p>
<p>然后我顺便安装了几个我比较喜欢的模块，Net::Telnet，Net::POP3</p>
<p>安装的时候可以看到我们的perl模块都是安装在/usr/local/lib/perl/5.18.2里面的，还有这个目录/usr/local/share/perl/5.18.2/</p>
<p>其实可以直接查看@INC这个默认变量，perl -e '{print "$_\n" foreach @INC}'</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念646.png"><img class="alignnone size-full wp-image-583" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念646.png" alt="Perl及R及python模块碎碎念646" width="554" height="150" /></a></p>
<p>就知道自己的perl安装在哪些位置了</p>
<p>&nbsp;</p>
<p><a href="mailto:万一没有root权限，那么除非是管理员安装了那些模块，否则很多都是不能用的，那么自己要想安装，就必须自己也用cpan，但是cpan只会把模块安装到自己的目录下面，那么每次使用这个模块都必须添加该模块到@INC这个变量里面，这样perl程序才能找到你自己安装的模块，如果是非root用户，使用cpan，那么一般会创建/home/jmzeng/.bashrc这个目录下面存储个人的perl模块。">万一没有root权限，那么除非是管理员安装了那些模块，否则很多都是不能用的，那么自己要想安装，就必须自己也用cpan，但是cpan只会把模块安装到自己的目录下面，那么每次使用这个模块都必须添加该模块到@INC这个变量里面，这样perl程序才能找到你自己安装的模块，如果是非root用户，使用cpan，那么一般会创建/home/yourname/.cpan这个隐藏目录下面存储个人的perl模块。</a></p>
<p>use lib '/home/your-home/perl_lib';</p>
<p>因为有cpan，安装模块也是非常方便的。</p>
<p>我测试了一下，install GD模块</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念1142.png"><img class="alignnone size-full wp-image-584" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念1142.png" alt="Perl及R及python模块碎碎念1142" width="554" height="289" /></a></p>
<p>擦，好像这个模块安装不了，真奇怪，还需要root权限！可我记得我在前面的服务器没有root权限也安装过一些自己的包，好奇怪呀，可能是这个包的要求比较高吧！我之前安装成功过好几个包Mail-POP3Client等等。</p>
<p>那自己安装模块就只能下载源码包，随便安装后，添加目录到@INC了</p>
<h1><b>2,R的包</b></h1>
<p>如果有root权限，那么直接进入R，里面</p>
<p>&gt; .libPaths()</p>
<p>[1] "/usr/local/lib/R/site-library" "/usr/lib/R/site-library"</p>
<p>[3] "/usr/lib/R/library"</p>
<p>这样就可以看到自己的R包都放在哪些目录下面，这样也可以进去查看这些目录里面的包。</p>
<p>另外一个命令，可以查看本机安装的R包有哪些！installed.packages()[,1]</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念1508.png"><img class="alignnone size-full wp-image-585" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念1508.png" alt="Perl及R及python模块碎碎念1508" width="554" height="204" /></a></p>
<p>安装一个包也是非常简单的！</p>
<p>但是，如果没有root权限，也是很简单的，同样的install.packages即可，可以创建一个私人的R包存放目录。</p>
<p>~/R/x86_64-pc-linux-gnu-library/3.1</p>
<p>但是R包安装有时候会出现这种错误，但是只出现一次，所以一般是高手解决了。</p>
<p>R包安装 had non-zero exit status，解决方法是</p>
<p>apt-get install  tcl-dev tk-dev</p>
<p>sudo apt-get install libxml2-dev &amp; sudo apt-get install libcurl4-openssl-dev</p>
<p>R这个东西，我个人是不怎么用的，因为数据处理的脚本都是用perl，也就用bioconductor的R包来画一些图，不然就是自己用ggplot2包画一些漂亮的图，但是是在windows平台的，不会在linux平台下面画图的，太麻烦了！</p>
<h2><strong>3、python模块安装</strong></h2>
<p>一．有root权限那一切好办啦！</p>
<p>直接下载包，然后进入，输入</p>
<p>python setup.py install的前提是你安装了 setuptools 工具</p>
<p>Traceback (most recent call last):</p>
<p>File "setup.py", line 6, in &lt;module&gt;</p>
<p>from setuptools import setup, Extension</p>
<p>ImportError: No module named setuptools</p>
<p>解决方法是apt-get install python-setuptools</p>
<p>当然只有在ubuntu才有这么高效啦！但是我还报错了</p>
<p>fatal error: Python.h: No such file or directory</p>
<p>重新搜索了一下，需要apt-get install python2.7-dev</p>
<p>安装这个python的库文件，里面才有python.h这个文件啦</p>
<p>也是全自动化完成啦！</p>
<p>Unpacking libpython2.7-dev:amd64 (2.7.6-8) ...</p>
<p>Selecting previously unselected package python2.7-dev.</p>
<p>Preparing to unpack .../python2.7-dev_2.7.6-8_amd64.deb ...</p>
<p>Unpacking python2.7-dev (2.7.6-8) ...</p>
<p>Processing triggers for man-db (2.6.7.1-1) ...</p>
<p>Setting up libpython2.7-dev:amd64 (2.7.6-8) ...</p>
<p>Setting up python2.7-dev (2.7.6-8) ...</p>
<p>然后终于不报错啦！！！！Python这个东西真难玩，我还是喜欢perl</p>
<p>Using /usr/lib/python2.7/dist-packages</p>
<p>Finished processing dependencies for rpy2==2.5.6</p>
<p>Python的模块都安装在/usr/lib/python2.7/dist-packages这个目录下面</p>
<p>&nbsp;</p>
<p>二．没有root权限，就把python安装到自己的模块！安装之后就会增加一个.local目录，存放着python的模块。</p>
<p>&nbsp;</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念2823.png"><img class="alignnone size-full wp-image-586" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/04/Perl及R及python模块碎碎念2823.png" alt="Perl及R及python模块碎碎念2823" width="554" height="520" /></a></p>
<p>&nbsp;</p>
<p>但是如果是自己目录安装python模块需要修改~/.bashrc这个文件，并且</p>
<p>export PYTHONPATH=$PYTHONPATH:/my/other/path</p>
<p>这样在python里面才能调用这个模块。</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/581.html/feed</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>云服务器试用报告</title>
		<link>http://www.bio-info-trainee.com/526.html</link>
		<comments>http://www.bio-info-trainee.com/526.html#comments</comments>
		<pubDate>Mon, 30 Mar 2015 01:15:23 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[linux]]></category>
		<category><![CDATA[安装]]></category>
		<category><![CDATA[服务器]]></category>
		<category><![CDATA[配置]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=526</guid>
		<description><![CDATA[刚买了一个空的云服务器，所以就试用体验了一下！ 一．硬盘容量，系统盘很小，就30 &#8230; <a href="http://www.bio-info-trainee.com/526.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>刚买了一个空的云服务器，所以就试用体验了一下！</p>
<p>一．硬盘容量，系统盘很小，就30个G，但是有一个1T的空盘，自己格式化安装并挂载即可。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告53.png"><img class="alignnone size-full wp-image-527" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告53.png" alt="云服务器试用报告53" width="554" height="160" /></a></p>
<p>&nbsp;</p>
<p>二．内存状况，11G</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告67.png"><img class="alignnone size-full wp-image-528" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告67.png" alt="云服务器试用报告67" width="554" height="118" /></a></p>
<p>三。Cup数量，12核</p>
<p>&nbsp;</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告79.png"><img class="alignnone size-full wp-image-529" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告79.png" alt="云服务器试用报告79" width="554" height="306" /></a></p>
<p>四．磁盘文件状况</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告90.png"><img class="alignnone size-full wp-image-530" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告90.png" alt="云服务器试用报告90" width="553" height="98" /></a></p>
<p>&nbsp;</p>
<p>五．开通其它账号</p>
<p>adduser</p>
<p>六．服务器其它信息</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告119.png"><img class="alignnone size-full wp-image-531" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告119.png" alt="云服务器试用报告119" width="554" height="354" /></a></p>
<p>&nbsp;</p>
<p>七．测试下载速度</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告130.png"><img class="alignnone size-full wp-image-532" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告130.png" alt="云服务器试用报告130" width="554" height="162" /></a></p>
<p>&nbsp;</p>
<p>八．磁盘分区管理</p>
<p>&nbsp;</p>
<p>首先看到的是32.2GB的系统盘，是标示符是xvda盘，被分成了三个区</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告141.png"><img class="alignnone size-full wp-image-533" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告141.png" alt="云服务器试用报告141" width="554" height="206" /></a></p>
<p>然后是一个1T的硬盘，需要分区然后挂载</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告199.png"><img class="alignnone size-full wp-image-534" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告199.png" alt="云服务器试用报告199" width="554" height="138" /></a></p>
<p>我分区后，分割成两个盘，一个给各个用户，还有一个放公共数据</p>
<p>apt-get install nfs-common</p>
<p>mkfs -t ext4 /dev/xvdd</p>
<p>mkfs.ext4 /dev/xvdd1</p>
<p>mount -t ext4 /dev/xvdd1 /home/</p>
<p>mount -t ext4 /dev/xvdd2  /data</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告366.png"><img class="alignnone size-full wp-image-535" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告366.png" alt="云服务器试用报告366" width="554" height="204" /></a></p>
<p>&nbsp;</p>
<p>九．脚本环境</p>
<p>This is perl 5, version 18, subversion 2 (v5.18.2)</p>
<p>/usr/lib/python2.7/site.pyc matches /usr/lib/python2.7/site.py</p>
<p>十．库文件状况</p>
<p>apt-get install unzip</p>
<p>apt-get install make</p>
<p>apt-get install gcc</p>
<p>十一．软件安装状况</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告570.png"><img class="alignnone size-full wp-image-536" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/云服务器试用报告570.png" alt="云服务器试用报告570" width="512" height="234" /></a></p>
<p>&nbsp;</p>
<p>常用生物信息学软件都可以自己安装，并且可以使用。</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/526.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>Samtools安装及使用</title>
		<link>http://www.bio-info-trainee.com/518.html</link>
		<comments>http://www.bio-info-trainee.com/518.html#comments</comments>
		<pubDate>Sun, 29 Mar 2015 13:45:27 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[基础软件]]></category>
		<category><![CDATA[生信基础]]></category>
		<category><![CDATA[sam]]></category>
		<category><![CDATA[samtools]]></category>
		<category><![CDATA[安装]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=518</guid>
		<description><![CDATA[一、下载安装该软件。 网上可以搜索到下载地址，解压之后make即可 一般都会报错 &#8230; <a href="http://www.bio-info-trainee.com/518.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>一、下载安装该软件。</p>
<p>网上可以搜索到下载地址，解压之后make即可</p>
<p>一般都会报错</p>
<p>In file included from bam_cat.c:41:0:</p>
<p>htslib-1.1/htslib/bgzf.h:34:18: fatal error: zlib.h: No such file or directory</p>
<p><b> #include &lt;zlib.h&gt;</b></p>
<p>^</p>
<p>compilation terminated.</p>
<p>make: *** [bam_cat.o] Error 1</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/Samtools安装及使用265.png"><img class="alignnone size-full wp-image-519" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/Samtools安装及使用265.png" alt="Samtools安装及使用265" width="552" height="510" /></a></p>
<p>然后，居然就通过了，晕。<span style="color: #ff0000;"><strong>有时候我实在是搞不定linux系统一些具体的原理</strong></span>，但是反正就是能用！学会搜索，学会试错即可。</p>
<p>直到两年后我才理解（linux下 的软件安装需要指定路径，而且是自己有权限的路径，2016年11月23日10:12:11），比如安装下面的方式来安装软件：</p>
<p><strong><span style="color: #ff0000;">mkdir -p ~/biosoft/myBin</span></strong><br />
<strong><span style="color: #ff0000;">echo 'export PATH=/home/jianmingzeng/biosoft/myBin/bin:$PATH' &gt;&gt;~/.bashrc </span></strong><br />
<strong><span style="color: #ff0000;">source ~/.bashrc</span></strong><br />
<strong><span style="color: #ff0000;">cd ~/biosoft</span></strong><br />
<strong><span style="color: #ff0000;">mkdir cmake &amp;&amp; cd cmake</span></strong><br />
<strong><span style="color: #ff0000;">wget http://cmake.org/files/v3.3/cmake-3.3.2.tar.gz</span></strong><br />
<strong><span style="color: #ff0000;">tar xvfz cmake-3.3.2.tar.gz</span></strong><br />
<strong><span style="color: #ff0000;">cd cmake-3.3.2 </span></strong><br />
<strong><span style="color: #ff0000;">./configure --prefix=/home/jianmingzeng/biosoft/myBin  ## 这里非常重要</span></strong><br />
<strong><span style="color: #ff0000;">make </span></strong><br />
<strong><span style="color: #ff0000;">make install </span></strong></p>
<p>但是有些电脑会报另外一个错</p>
<p>#include &lt;curses.h&gt;</p>
<p>^</p>
<p>compilation terminated.</p>
<p>make: *** [bam_tview_curses.o] Error 1</p>
<p>我也顺便解决一下，因为以前我的服务器遇到过，也是很纠结的。</p>
<p>sudo apt-get install libncurses5-dev</p>
<p>二．准备数据及使用，见我的snp-caling流程</p>
<p><a href="http://www.bio-info-trainee.com/?p=439">http://www.bio-info-trainee.com/?p=439</a></p>
<p>samtools view -bS <b>tmp1.sam &gt; tmp1.bam</b></p>
<p>samtools sort <b>tmp1.bam tmp1.sorted</b></p>
<p>samtools <b>index tmp1.sorted.bam </b></p>
<p>samtools mpileup -d 1000  -gSDf   ../../../ref-database/hg19.fa  tmp1.sorted.bam |bcftools view -cvNg –  &gt;<b>tmp1.vcf</b></p>
<p>因为这个软件都是与bwa和bowtie等能产生sam文件的软件合作才能使用。</p>
<p>其中这个软件参数还是蛮多的，但是常用的就那么几个，网上也很容易找到教程</p>
<p>简单附上一点资料</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p><a href="http://www.plob.org/tag/samtools">samtools</a>是一个用于操作sam和bam文件的工具合集。包含有许多命令。以下是常用命令的介绍</p>
<h2><b>1. view</b></h2>
<p>view命令的主要功能是：将sam文件转换成bam文件；然后对bam文件进行各种操作，比如数据的排序(不属于本命令的功能)和提取(这些操作是对bam文件进行的，因而当输入为sam文件的时候，不能进行该操作)；最后将排序或提取得到的数据输出为bam或sam（默认的）格式。</p>
<p>bam文件优点：bam文件为二进制文件，占用的磁盘空间比sam文本文件小；利用bam二进制文件的运算速度快。</p>
<p>view命令中，对sam文件头部的输入(-t或-T）和输出(-h)是单独的一些参数来控制的。</p>
<p>Usage: samtools view [options] &lt;in.bam&gt;|&lt;in.sam&gt; [region1 [...]]默认情况下不加 region，则是输出所有的 region. Options:</p>
<p>-b       output BAM                  默认下输出是 SAM 格式文件，该参数设置输出 BAM 格式         -h       print header for the SAM output                  默认下输出的 sam 格式文件不带 header，该参数设定输出sam文件时带 header 信息         -H       print header only (no alignments)         -S       input is SAM                  默认下输入是 BAM 文件，若是输入是 SAM 文件，则最好加该参数，否则有时候会报错。</p>
<p>例子：</p>
<p>#将sam文件转换成bam文件$ samtools view -bS abc.sam &gt; abc.bam$ samtools view -b -S abc.sam -o abc.bam</p>
<p>#提取比对到参考序列上的比对结果$ samtools view -bF 4 abc.bam &gt; abc.F.bam #提取paired reads中两条reads都比对到参考序列上的比对结果，只需要把两个4+8的值12作为过滤参数即可$ samtools view -bF 12 abc.bam &gt; abc.F12.bam #提取没有比对到参考序列上的比对结果$ samtools view -bf 4 abc.bam &gt; abc.f.bam #提取bam文件中比对到caffold1上的比对结果，并保存到sam文件格式$ samtools view abc.bam scaffold1 &gt; scaffold1.sam #提取scaffold1上能比对到30k到100k区域的比对结果$ samtools view abc.bam scaffold1:30000-100000 &gt; scaffold1_30k-100k.sam #根据fasta文件，将 header 加入到 sam 或 bam 文件中$ samtools view -T genome.fasta -h scaffold1.sam &gt; scaffold1.h.sam</p>
<h2><b>2. sort</b></h2>
<p>sort对bam文件进行排序。</p>
<p>Usage: samtools sort [-n] [-m &lt;maxMem&gt;] &lt;in.bam&gt; &lt;out.prefix&gt;  -m 参数默认下是 500,000,000 即500M（不支持K，M，G等缩写）。对于处理大数据时，如果内存够用，则设置大点的值，以节约时间。-n 设定排序方式按short reads的ID排序。默认下是按序列在fasta文件中的顺序（即header）和序列从左往右的位点排序。</p>
<p>例子：</p>
<p>$ samtools sort abc.bam abc.sort$ samtools view abc.sort.bam | less -S</p>
<h2><b>3.merge</b></h2>
<p>将2个或2个以上的已经sort了的bam文件融合成一个bam文件。融合后的文件不需要则是已经sort过了的。</p>
<p>Usage:   samtools merge [-nr] [-h inh.sam] &lt;out.bam&gt; &lt;in1.bam&gt; &lt;in2.bam&gt;[...] Options: -n       sort by read names         -r       attach RG tag (inferred from file names)         -u       uncompressed BAM output         -f       overwrite the output BAM if exist         -1       compress level 1         -R STR   merge file in the specified region STR [all]         -h FILE  copy the header in FILE to &lt;out.bam&gt; [in1.bam] Note: Samtools' merge does not reconstruct the @RG dictionary in the header. Users      must provide the correct header with -h, or uses Picard which properly maintains      the header dictionary in merging.</p>
<h2><b>4.index</b></h2>
<p>必须对bam文件进行默认情况下的排序后，才能进行index。否则会报错。</p>
<p>建立索引后将产生后缀为.bai的文件，用于快速的随机处理。很多情况下需要有bai文件的存在，特别是显示序列比对情况下。比如samtool的tview命令就需要；gbrowse2显示reads的比对图形的时候也需要。</p>
<p>Usage: samtools index &lt;in.bam&gt; [out.index]</p>
<p>例子：</p>
<p>#以下两种命令结果一样$ samtools index abc.sort.bam$ samtools index abc.sort.bam abc.sort.bam.bai</p>
<h2><b>5. faidx</b></h2>
<p>对fasta文件建立索引,生成的索引文件以.fai后缀结尾。该命令也能依据索引文件快速提取fasta文件中的某一条（子）序列</p>
<p>Usage: samtools faidx &lt;in.bam&gt; [ [...]] 对基因组文件建立索引$ samtools faidx genome.fasta#生成了索引文件genome.fasta.fai,是一个文本文件，分成了5列。第一列是子序列的名称；第二列是子序列的长度；个人认为“第三列是序列所在的位置”，因为该数字从上往下逐渐变大，最后的数字是genome.fasta文件的大小；第4和5列不知是啥意思。于是通过此文件，可以定位子序列在fasta文件在磁盘上的存放位置，直接快速调出子序列。 #由于有索引文件，可以使用以下命令很快从基因组中提取到fasta格式的子序列$ samtools faidx genome.fasta scffold_10 &gt; scaffold_10.fasta</p>
<h2><b>6. tview</b></h2>
<p>tview能直观的显示出reads比对基因组的情况，和基因组浏览器有点类似。</p>
<p>Usage: samtools tview &lt;aln.bam&gt; [ref.fasta] 当给出参考基因组的时候，会在第一排显示参考基因组的序列，否则，第一排全用N表示。按下 g ，则提示输入要到达基因组的某一个位点。例子“scaffold_10:1000"表示到达第10号scaffold的第1000个碱基位点处。使用H(左）J（上）K（下）L（右）移动显示界面。大写字母移动快，小写字母移动慢。使用空格建向左快速移动（和 L 类似），使用Backspace键向左快速移动（和 H 类似）。Ctrl+H 向左移动1kb碱基距离； Ctrl+L 向右移动1kb碱基距离可以用颜色标注比对质量，碱基质量，核苷酸等。30～40的碱基质量或比对质量使用白色表示；20～30黄色；10～20绿色；0～10蓝色。使用点号'.'切换显示碱基和点号；使用r切换显示read name等还有很多其它的使用说明，具体按 ？ 键来查看。</p>
<p>&nbsp;</p>
<p>参考：<a href="http://www.plob.org/tag/samtools">samtools</a>的说明文档：<a href="http://samtools.sourceforge.net/samtools.shtml">http://samtools.sourceforge.net/samtools.shtml</a></p>
<p><a href="http://www.plob.org/2014/01/26/7112.html">http://www.plob.org/2014/01/26/7112.html</a></p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/518.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
