<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; cgdsr</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/cgdsr/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>使用R包cgdsr来下载TCGA的数据</title>
		<link>http://www.bio-info-trainee.com/1257.html</link>
		<comments>http://www.bio-info-trainee.com/1257.html#comments</comments>
		<pubDate>Thu, 24 Dec 2015 14:36:59 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[基础数据库]]></category>
		<category><![CDATA[cancer]]></category>
		<category><![CDATA[cbioportal]]></category>
		<category><![CDATA[cgdsr]]></category>
		<category><![CDATA[TCGA]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=1257</guid>
		<description><![CDATA[前面我讲到TCGA的数据可以在5个组织机构可以获取，他们都提供了类似的接口来供用 &#8230; <a href="http://www.bio-info-trainee.com/1257.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>前面我讲到TCGA的数据可以在5个组织机构可以获取，他们都提供了类似的接口来供用户下载数据</p>
<p>每个接口都有使用教程，比如<a href="http://firebrowse.org/tutorial/FireBrowse-Tutorial.pdf">http://firebrowse.org/tutorial/FireBrowse-Tutorial.pdf</a></p>
<p>非常详细！！！</p>
<p>有的还专门写了软件接口：<a href="https://confluence.broadinstitute.org/display/GDAC/Download">https://confluence.broadinstitute.org/display/GDAC/Download</a></p>
<p>或者写了R的接口：<a href="http://www.cbioportal.org/cgds_r.jsp">http://www.cbioportal.org/cgds_r.jsp</a></p>
<p>接下来我们要讲的就是<strong>cbioportal</strong>网站提供的一个R接口，非常好用，只需记住4个函数即可！！！<span id="more-1257"></span></p>
<p>只需熟记<strong>getCancerStudies</strong>，<strong>getCaseLists</strong>，<strong>getGeneticProfiles，getProfileData需要什么参数以及它们返回了什么对象即可！</strong></p>
<p>install.packages("cgdsr",repos="<a href="http://cran.us.r-project.org/">http://cran.us.r-project.org</a>")<br />
library(cgdsr)<br />
mycgds &lt;- CGDS("<a href="http://www.cbioportal.org/public-portal/">http://www.cbioportal.org/public-portal/</a>")<br />
test(mycgds)<br />
# Get list of cancer studies at server<br />
## 获取有哪些数据集<br />
all_TCGA_studies &lt;- <strong>getCancerStudies</strong>(mycgds)</p>
<p>第一个函数就是获取我们的cbioportal网站里面存储的关于<strong>TCGA的研究项目列表（每个study都是一篇文章）</strong>，至今有126个(2016年7月12日21:37:40)</p>
<p>具体的文章可以见：<a href="https://tcga-data.nci.nih.gov/docs/publications/">https://tcga-data.nci.nih.gov/docs/publications/</a></p>
<p>前面我下载过胃癌的RNA表达数据，我们这里可以验证一下：</p>
<p>我这里用R来下载一次看看</p>
<p>stad2014 &lt;- "<strong>stad_tcga_pub</strong>"   ##这篇文章里面的数据</p>
<p>## 获取在stad2014数据集中有哪些样本列表，</p>
<p>all_tables &lt;- <strong>getCaseLists</strong>(mycgds, stad2014)</p>
<p>dim(all_tables)</p>
<p>## 我们需要验证一下下载的mRNA表达量数据，所以我们选择下面这个样本列表</p>
<p>my_table &lt;- "<strong>stad_tcga_pub_rna_seq_v2_mrna</strong>"</p>
<p>## 而后获取有哪些数据可以下载</p>
<p>all_dataset &lt;- <strong>getGeneticProfiles</strong>(mycgds, stad2014)</p>
<p>my_dataset &lt;- '<strong>stad_tcga_pub_rna_seq_v2_mrna</strong>'  ##然后我们选择下载mRNA数据</p>
<p>BRCA1 &lt;- <strong>getProfileData</strong>(mycgds, "<strong>BRCA1</strong>", my_dataset, my_table)  ## 根据my_table这个样本列表来下载my_dataset这种数据</p>
<p>##还可以下载临床数据来对比</p>
<p>getClinicalData(mycgds, my_table) ##临床数据经常下载失败，不知道为什么</p>
<p>拿到的数据，就可以与之前在TCGA官网里面下载的数据比较啦！！</p>
<p>但是下面的链接已经失效啦！</p>
<p>临床数据：<a href="https://tcga-data.nci.nih.gov/docs/publications/stad_2014/20140110_STAD_Clinical_Data_Blacklisted_Cases_Removed.xlsx">https://tcga-data.nci.nih.gov/docs/publications/stad_2014/20140110_STAD_Clinical_Data_Blacklisted_Cases_Removed.xlsx</a></p>
<p>RPKM值表达数据：<a href="https://tcga-data.nci.nih.gov/docs/publications/stad_2014/RPKM_Expression_Matrix.291Samples_GAF3genes.BCGSC.20131127.tsv">https://tcga-data.nci.nih.gov/docs/publications/stad_2014/RPKM_Expression_Matrix.291Samples_GAF3genes.BCGSC.20131127.tsv</a></p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/1257.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
