<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; taxid</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/taxid/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>查某个基因家族在某物种的具体信息</title>
		<link>http://www.bio-info-trainee.com/332.html</link>
		<comments>http://www.bio-info-trainee.com/332.html#comments</comments>
		<pubDate>Wed, 18 Mar 2015 14:00:26 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[linux]]></category>
		<category><![CDATA[基础数据库]]></category>
		<category><![CDATA[gene]]></category>
		<category><![CDATA[ncbi]]></category>
		<category><![CDATA[taxid]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=332</guid>
		<description><![CDATA[查某个基因家族在某物种的具体信息 我很伤心，不知道是不是我写的教程还是不够人性化 &#8230; <a href="http://www.bio-info-trainee.com/332.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p style="text-align: center;"><b>查某个基因家族在某物种的具体信息</b></p>
<p>我很伤心，不知道是不是我写的教程还是不够人性化，一个朋友在群里面问如何知道NAC基因家族在拟南芥里面的105个基因信息，我随便给他示范了一下在人类里面如何找，希望他能触类旁通，结果他不会linux，啥生信基础都没有，我只会诱导他简单学习一下，希望他至少明白什么的taxid。所以我给了他我之前写的教程，只希望他告诉我拟南芥的taxid我就帮他把那105个基因找出来。<span id="more-332"></span></p>
<p><a href="http://www.bio-info-trainee.com/?p=84">http://www.bio-info-trainee.com/?p=84</a></p>
<p>结果好半天都不回信息了，我还以为他自己解决了，我礼貌性的再问一次，才知道他没看懂我的教程，我实在不明白，那么通俗的教程为嘛还是不能亲民呢？？？</p>
<p>拟南芥的拉丁名是Arabidopsis thaliana，在NCBI的Taxonomy里面搜索可以看到</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/查某个基因家族在某物种的具体信息582.png"><img class="alignnone size-full wp-image-333" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/查某个基因家族在某物种的具体信息582.png" alt="查某个基因家族在某物种的具体信息582" width="627" height="259" /></a></p>
<p>然后点击进去</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/查某个基因家族在某物种的具体信息757.png"><img class="alignnone size-full wp-image-334" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/查某个基因家族在某物种的具体信息757.png" alt="查某个基因家族在某物种的具体信息757" width="553" height="486" /></a></p>
<p>就简单的两个步骤呀，就可以看到taxid的呀！！！</p>
<p>然后我只需要简单一个命令就可以解决题目的问题了！</p>
<p>grep -w  NAC  gene_info |perl -alne '{print if $F[0] == 3702}'</p>
<p>其中gene_info在NCBI的ftp里面可以下载！！我前面也提到过，是所以物种的基因信息</p>
<p>我只需要查找基因名字是NAC的，然后物种代码是3702的就是他拟南芥的呀！！！</p>
<p>正好105个基因，达到了他的要求！！！</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/查某个基因家族在某物种的具体信息930.png"><img class="alignnone size-full wp-image-335" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/查某个基因家族在某物种的具体信息930.png" alt="查某个基因家族在某物种的具体信息930" width="249" height="524" /></a></p>
<p>&nbsp;</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/332.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>NCBI的taxid简单介绍</title>
		<link>http://www.bio-info-trainee.com/84.html</link>
		<comments>http://www.bio-info-trainee.com/84.html#comments</comments>
		<pubDate>Tue, 10 Mar 2015 14:08:37 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[基础数据库]]></category>
		<category><![CDATA[ncbi]]></category>
		<category><![CDATA[taxid]]></category>
		<category><![CDATA[物种分类]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=84</guid>
		<description><![CDATA[ NCBI的taxid简单介绍 物种的信息集合都在它的NCBI的taxid号里面 &#8230; <a href="http://www.bio-info-trainee.com/84.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p style="text-align: center;"><strong> NCBI的taxid简单介绍</strong></p>
<p>物种的信息集合都在它的NCBI的taxid号里面，在NCBI里面关于它的英文介绍地址如下 <a href="http://www.ncbi.nlm.nih.gov/guide/taxonomy/">http://www.ncbi.nlm.nih.gov/guide/taxonomy/</a> ，NCBI人为的给自然界所有的物种都给了一个编号，这个编号就是taxid，是根据计算机里面树这种数据结构来编码的，其中人类的编号是 9606，7227是果蝇，我们只需要进入这个物种的taxid里面就能看的关于它的一切NCBI存在并且收集好的信息。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/NCBI的taxid简单介绍288.png"><img class="alignnone size-full wp-image-85" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/NCBI的taxid简单介绍288.png" alt="NCBI的taxid简单介绍288" width="494" height="354" /></a></p>
<p>&nbsp;</p>
<p><span id="more-84"></span></p>
<p>可以看到NCBI到2015年为止已经收录近50万的物种的基因。</p>
<p>我们可以进入人类的9606这个ID里面进去看看</p>
<p><a href="http://www.ncbi.nlm.nih.gov/taxonomy/?term=9606[uid]">http://www.ncbi.nlm.nih.gov/taxonomy/?term=9606[uid]</a></p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/NCBI的taxid简单介绍468.png"><img class="alignnone size-full wp-image-86" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/NCBI的taxid简单介绍468.png" alt="NCBI的taxid简单介绍468" width="489" height="81" /></a></p>
<p>可以看出，人类这个并不是最底层的taxid类别，下面还有两个分类</p>
<p>关于人类这个物种的信息是非常多的</p>
<p><a href="http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?mode=Info&amp;id=9606&amp;lvl=3&amp;lin=f&amp;keep=1&amp;srchmode=1&amp;unlock">http://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi?mode=Info&amp;id=9606&amp;lvl=3&amp;lin=f&amp;keep=1&amp;srchmode=1&amp;unlock</a></p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/NCBI的taxid简单介绍758.png"><img class="alignnone size-full wp-image-87" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/NCBI的taxid简单介绍758.png" alt="NCBI的taxid简单介绍758" width="307" height="723" /></a></p>
<p>但是它下面的两个亚种人，就比较少的信息。</p>
<p>关于这个taxid的资料还有很多 <a href="ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/">ftp://ftp.ncbi.nlm.nih.gov/pub/taxonomy/</a></p>
<p>其中我们可以下载 wget  <a href="ftp://ftp.ncbi.nih.gov/pub/taxonomy/taxdump.tar.gz">ftp://ftp.ncbi.nih.gov/pub/taxonomy/taxdump.tar.gz</a> 这个文件，解压可以看到里面有以下文件，其中比较重要的两个文件</p>
<p><b>nodes.dmp</b><b> 这个文件列出了taxid的树的结构信息，子节点，父节点等等</b></p>
<p><b>names.dmp</b><b> 这个文件里面列出了每个独特的taxid对应着的物种名</b></p>
<p>其它信息不重要，自己看咯</p>
<p>gencode.dmp</p>
<p>-----------</p>
<p>Genetic codes file:</p>
<p>&nbsp;</p>
<p>genetic code id -- GenBank genetic code id</p>
<p>abbreviation -- genetic code name abbreviation</p>
<p>name -- genetic code name</p>
<p>cde -- translation table for this genetic code</p>
<p>starts -- start codons for this genetic code</p>
<p>&nbsp;</p>
<p>delnodes.dmp</p>
<p>------------</p>
<p>Deleted nodes (nodes that existed but were deleted) file field:</p>
<p>&nbsp;</p>
<p>tax_id -- deleted node id</p>
<p>&nbsp;</p>
<p>merged.dmp</p>
<p>----------</p>
<p>Merged nodes file fields:</p>
<p>&nbsp;</p>
<p>old_tax_id                              -- id of nodes which has been merged</p>
<p>new_tax_id                              -- id of nodes which is result of merging</p>
<p>&nbsp;</p>
<p>citations.dmp</p>
<p>-------------</p>
<p>Citations file fields:</p>
<p>&nbsp;</p>
<p>cit_id -- the unique id of citation</p>
<p>cit_key -- citation key</p>
<p>pubmed_id -- unique id in PubMed database (0 if not in PubMed)</p>
<p>medline_id -- unique id in MedLine database (0 if not in MedLine)</p>
<p>url -- URL associated with citation</p>
<p>text -- any text (usually article name and authors)</p>
<p>-- The following characters are escaped in this text by a backslash:</p>
<p>-- newline (appear as "\n"),</p>
<p>-- tab character ("\t"),</p>
<p>-- double quotes ('\"'),</p>
<p>-- backslash character ("\\").</p>
<p>taxid_list -- list of node ids separated by a single space</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/84.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
