<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; ALL</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/all/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>R语言里面的一个数据集ALL(Acute Lymphoblastic Leukemia)简介</title>
		<link>http://www.bio-info-trainee.com/693.html</link>
		<comments>http://www.bio-info-trainee.com/693.html#comments</comments>
		<pubDate>Mon, 04 May 2015 07:52:40 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[基础数据库]]></category>
		<category><![CDATA[生信基础]]></category>
		<category><![CDATA[ALL]]></category>
		<category><![CDATA[bioconductor]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=693</guid>
		<description><![CDATA[这个数据内容太多了，我感觉自己也理解的不是很清楚！ 非常多的R的biocondu &#8230; <a href="http://www.bio-info-trainee.com/693.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>这个数据内容太多了，我感觉自己也理解的不是很清楚！</p>
<p><b></b>非常多的R的bioconductor包都是拿这个数据集来举例子的，所以我简单的介绍一下这个数据集。</p>
<p>这个数据集是对ALL这个病的研究数据，共涉及到了128个ALL病人，其中95个是B细胞的ALL，剩余33个是T细胞的ALL。</p>
<p>是一个芯片数据，同时还包含有其它的病人信息。</p>
<p>大家首先要在R里面安装这个数据集</p>
<p>source("http://bioconductor.org/biocLite.R")</p>
<p>biocLite("ALL")</p>
<p>library(ALL)</p>
<p>data(ALL)</p>
<p>data(geneList)</p>
<p>在R里面输入str(ALL)可以看到这个数据的具体信息，但是非常多!</p>
<p>ALL</p>
<p>ExpressionSet (storageMode: lockedEnvironment)</p>
<p><b><i>assayData: 12625 features, 128 samples </i></b></p>
<p>element names: exprs</p>
<p>protocolData: none</p>
<p>phenoData</p>
<p>sampleNames: 01005 01010 ... LAL4 (128 total)</p>
<p>varLabels: cod diagnosis ... date last seen (21 total)</p>
<p>varMetadata: labelDescription</p>
<p>featureData: none</p>
<p>experimentData: use 'experimentData(object)'</p>
<p><b> pubMedIds: 14684422 16243790 </b></p>
<p>Annotation: hgu95av2</p>
<p>我们首先它的BT变量记录的是什么</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/R语言里面的一个数据集ALL750.png"><img class="alignnone size-full wp-image-694" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/R语言里面的一个数据集ALL750.png" alt="R语言里面的一个数据集ALL750" width="554" height="108" /></a></p>
<p>可以看出它记录的是数据病人的分组信息。</p>
<p>bcell = grep("^B", as.character(ALL$BT))通过这句话可以挑选出B细胞病人</p>
<p>然后我们看看它的ALL$mol.biol变量记录是是什么</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/R语言里面的一个数据集ALL857.png"><img class="alignnone size-full wp-image-695" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/R语言里面的一个数据集ALL857.png" alt="R语言里面的一个数据集ALL857" width="554" height="241" /></a></p>
<p>可以看到它记录的是这些病人的几种突变情况（molecular biology testing）</p>
<p>types = c("NEG", "BCR/ABL")</p>
<p>moltyp = which(as.character(ALL$mol.biol) %in% types)</p>
<p>用这个命令就能挑选出我们想研究的两组突变的病人。</p>
<p>然后我们还可以把刚才的两个标准用来从ALL数据集里面取想要的子集</p>
<p>ALL_bcrneg = ALL[, intersect(bcell, moltyp)]</p>
<p>&nbsp;</p>
<p>&nbsp;</p>
<p>同理我们可以查看这个数据集的非常多的变量信息。</p>
<p>包括sex，age，cod，diagnosis，等等，这个'data.frame':共有128 obs. of  21 variables:</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/R语言里面的一个数据集ALL1190.png"><img class="alignnone size-full wp-image-696" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/R语言里面的一个数据集ALL1190.png" alt="R语言里面的一个数据集ALL1190" width="554" height="565" /></a></p>
<p>&nbsp;</p>
<p>我们除了可以查看这个ALL数据集自带的变量，还可以通过一些方法来访问它的其它信息。</p>
<p>Exprs这个方法可以查看它的表达数据，可以看到有128个变量，12625行的探针数据。</p>
<p><b>str(exprs(ALL))</b></p>
<p>num [1:12625, 1:128] 7.6 5.05 3.9 5.9 5.93 ...</p>
<p>- attr(*, "dimnames")=List of 2</p>
<p>..$ : chr [1:12625] "1000_at" "1001_at" "1002_f_at" "1003_s_at" ...</p>
<p>..$ : chr [1:128] "01005" "01010" "03002" "04006" ...</p>
<p>&nbsp;</p>
<p>还有很多很多函数都可以操作这个数据集，这样可以得到非常多的信息！我就不一一列举了</p>
<p>对这个数据的一系列操作可以画热图，见下面的教程！！！</p>
<p><a href="http://www2.warwick.ac.uk/fac/sci/moac/people/students/peter_cock/r/heatmap/">http://www2.warwick.ac.uk/fac/sci/moac/people/students/peter_cock/r/heatmap/</a></p>
<p>&nbsp;</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/693.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
