<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; 蛋白相互作用</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/%e8%9b%8b%e7%99%bd%e7%9b%b8%e4%ba%92%e4%bd%9c%e7%94%a8/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>下载最新的蛋白相互作用数据库-STRING</title>
		<link>http://www.bio-info-trainee.com/1589.html</link>
		<comments>http://www.bio-info-trainee.com/1589.html#comments</comments>
		<pubDate>Thu, 28 Apr 2016 12:02:47 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[基础数据库]]></category>
		<category><![CDATA[PPI]]></category>
		<category><![CDATA[string]]></category>
		<category><![CDATA[蛋白相互作用]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=1589</guid>
		<description><![CDATA[string数据库是PPI领域里面最完备已经最受欢迎的数据库了。如果直接在谷歌里 &#8230; <a href="http://www.bio-info-trainee.com/1589.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>string数据库是PPI领域里面最完备已经最受欢迎的数据库了。如果直接在谷歌里面搜索PPI，映入眼帘就是string的官网，它们的主页现在是html5啦，比较精美： <a href="http://string-db.org/">http://string-db.org/</a></p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2016/04/11.png"><img class="alignnone size-full wp-image-1590" src="http://www.bio-info-trainee.com/wp-content/uploads/2016/04/11.png" alt="1" width="425" height="342" /></a></p>
<p>写的很霸气，近两亿的记录，不过一般大家只会关心一个物种，比如人，其实还不到一千万！</p>
<p>我们直接进入下载界面，找到人类的数据，人类的物种ID是9606.</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2016/04/21.png"><img class="alignnone size-full wp-image-1591" src="http://www.bio-info-trainee.com/wp-content/uploads/2016/04/21.png" alt="2" width="316" height="310" /></a></p>
<p>需要一定许可才能下载完整版本，我这里测试最上面那个公开版本数据！</p>
<p>数据很简单，就是protein+protein+score，共八百多万行记录，记录着string数据库搜集的所有可能以及可信的蛋白相互作用！但是它的蛋白ID是ENSEMBL的ID，所以需要转换成基因的ID，才能被大多数人使用，因为大家的研究单位一般是基因，所以蛋白相互作用略等于基因相互作用。</p>
<p>基因ID转换，我推荐用org.Hs.eg.db这个R的包，很容易就可以实现的！</p>
<table class="GEM3DMTCOFB ace_text-layer ace_line GEM3DMTCKT" cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td align="left">
<blockquote>
<pre id="rstudio_console_output" class="GEM3DMTCFGB" tabindex="0"><span class="GEM3DMTCLGB ace_keyword">&gt; </span><span class="GEM3DMTCLFB ace_keyword">tmp=toTable(org.Hs.egENSEMBLPROT)
</span><span class="GEM3DMTCLGB ace_keyword">&gt; </span><span class="GEM3DMTCLFB ace_keyword">dim(tmp)
</span>[1] 110916      2
<span class="GEM3DMTCLGB ace_keyword">&gt; </span><span class="GEM3DMTCLFB ace_keyword">head(tmp)
</span>  gene_id         prot_id
1       1 ENSP00000263100
2       1 ENSP00000470909
3       2 ENSP00000443302
4       2 ENSP00000323929
5       2 ENSP00000438599
6       2 ENSP00000445717
</pre>
</blockquote>
</td>
</tr>
<tr>
<td align="left"></td>
</tr>
<tr>
<td align="left">
<table cellspacing="0" cellpadding="0">
<tbody>
<tr>
<td rowspan="1" align="left" width="1" height="">
<div class="GEM3DMTCLGB ace_keyword">&gt;</div>
</td>
</tr>
</tbody>
</table>
</td>
</tr>
</tbody>
</table>
<p>有约500多个蛋白ID是无法转换成对应的基因的，这个很正常，毕竟这种ID本来就不稳定，很多用着用着就失效了！</p>
<p>转换好之后就可以上传到数据库啦，然后可以供其它可视化或者分析程序使用！</p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/1589.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
