<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; lumi</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/lumi/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>用lumi包来处理illumina的bead系列表达芯片</title>
		<link>http://www.bio-info-trainee.com/1944.html</link>
		<comments>http://www.bio-info-trainee.com/1944.html#comments</comments>
		<pubDate>Sat, 15 Oct 2016 12:01:03 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[芯片数据处理]]></category>
		<category><![CDATA[bioconductor]]></category>
		<category><![CDATA[illumina]]></category>
		<category><![CDATA[lumi]]></category>
		<category><![CDATA[芯片]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=1944</guid>
		<description><![CDATA[表达芯片大家最熟悉的当然是affymetrix系列芯片啦，而且分析套路很简单，直 &#8230; <a href="http://www.bio-info-trainee.com/1944.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>表达芯片大家最熟悉的当然是affymetrix系列芯片啦，而且分析套路很简单，直接用R的affy包，就可以把cel文件经过RMA或者MAS5方法得到表达矩阵。illumina出厂的芯片略微有点不一样，它的原始数据有3个层级，一般拿到的是<span style="color: #ff0000;">Processed data</span> (<a href="ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE30nnn/GSE30669/suppl/GSE30669_HEK_Sample_Probe_Profile.txt.gz%20" target="_blank">示例</a>), 当仍然需要一系列的统计学方法才能提取到表达矩阵。我比较喜欢用bioconductor，所以下面讲一讲如何用lumi包来处理这个芯片数据！</p>
<div>这个lumi包的使用代码和说明书都有，按部就班的学一遍就好了。</div>
<div><a href="http://www.bioconductor.org/packages/release/bioc/vignettes/lumi/inst/doc/lumi.R">http://www.bioconductor.org/packages/release/bioc/vignettes/lumi/inst/doc/lumi.R</a></div>
<div><a href="http://www.bioconductor.org/packages/release/bioc/vignettes/lumi/inst/doc/lumi.pdf">http://www.bioconductor.org/packages/release/bioc/vignettes/lumi/inst/doc/lumi.pdf</a></div>
<div>如果仅仅是分析数据，那么并不难，但是每个分析步骤后面都隐含着一系列的统计学方法，想彻底搞清楚他它们， 就很难了。</div>
<p><span id="more-1944"></span></p>
<div>data(example.lumi)</div>
<div>lumi.N.Q &lt;- <span style="color: #ff0000;">lumiExpresso</span>(example.lumi)</div>
<div>dataMatrix &lt;- <span style="color: #ff0000;">exprs</span>(lumi.N.Q)</div>
<div>重点就是得到表达矩阵，它封装好了一个函数，lumiExpresso可以直接处理LumiBatch对象，这个函数结合了,N,T,B,Q(normalization,transformation,backgroud correction,qulity control)四个步骤，其中Q这个步骤又包括8种统计学图片。在该包的文章有详细说明：<a href="http://bioinformatics.oxfordjournals.org/content/24/13/1547.full " target="_blank">http://bioinformatics.oxfordjournals.org/content/24/13/1547.full </a></div>
<div>而 LumiBatch 对象是通过<span style="color: #ff0000;"> lumiR.batch 读取</span>的芯片文件被Illumina Bead Studio toolkit 处理的结果，也就是通常我们<span style="color: #ff0000;">从公司或者GEO下载的数据( level 3 的 process data)</span>，如下所示：</div>
<div><a href="http://www.bio-info-trainee.com/wp-content/uploads/2016/10/illumina-microarray-level3-data-example.png"><img class="alignnone size-full wp-image-1945" src="http://www.bio-info-trainee.com/wp-content/uploads/2016/10/illumina-microarray-level3-data-example.png" alt="illumina-microarray-level3-data-example" width="704" height="666" /></a></div>
<div></div>
<div>这个包用的<span style="color: #ff0000;">测试文件Barnes_gene_profile.txt</span>可以在<a href="http://www.chibi.ubc.ca/wp-content/uploads/2013/02/">http://www.chibi.ubc.ca/wp-content/uploads/2013/02/</a> 下载。</div>
<div>
<div>如果是在GEO下载公共数据，每个study都会给芯片描述文件，基本没有用，只需要下载<span style="color: #ff0000;">non-normalized.txt.gz类似的文件</span>就好了</div>
<div>GPL10558_HumanHT-12_V4_0_R1_15002873_B.txt.gz 13.1 Mb</div>
<div>GPL10558_HumanHT-12_V4_0_R2_15002873_B.txt.gz 13.1 Mb</div>
<div>比如我下载了：<a href="ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE30nnn/GSE30669/suppl/GSE30669_HEK_Sample_Probe_Profile.txt.gz">ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE30nnn/GSE30669/suppl/GSE30669_HEK_Sample_Probe_Profile.txt.gz</a> 这个文件，就可以直接用lumi包的lumiR.batch 函数读取文件成为LumiBatch对象，然后被lumiExpresso函数直接处理，然后被exprs函数提取表达矩阵。</div>
<blockquote>
<div>rm(list=ls())</div>
<div>library(lumi)</div>
<div># setwd('G:/array/illumina-beadseed-v4/lumi_example')</div>
<div># fileName &lt;- 'Barnes_gene_profile.txt' # Not Run</div>
<div>## 首先是从illumina的芯片结果文件，自己用R的lumi包来获取表达矩阵。</div>
<div>setwd('G:/array/illumina-beadseed-v4/GSE30669')</div>
<div>fileName &lt;- 'GSE30669_HEK_Sample_Probe_Profile.txt' # Not Run</div>
<div>x.lumi &lt;- lumiR.batch(fileName) ##, sampleInfoFile='sampleInfo.txt')</div>
<div>pData(phenoData(x.lumi))</div>
<div>## Do all the default preprocessing in one step</div>
<div>lumi.N.Q &lt;- lumiExpresso(x.lumi)</div>
<div>### retrieve normalized data</div>
<div>dataMatrix &lt;- exprs(lumi.N.Q)</div>
<div>## 下面是从GEO里面下载表达矩阵</div>
<div>rm(list=ls())</div>
<div>library(GEOquery)</div>
<div>library(limma)</div>
<div>GSE30669 &lt;- getGEO('GSE30669', destdir=".",getGPL = F)</div>
<div>exprSet=exprs(GSE30669[[1]])</div>
<div>GSE30669[[1]]</div>
<div>pdata=pData(GSE30669[[1]])</div>
<div>exprSet=exprs(GSE30669[[1]])</div>
<div>很明显可以看到前面得到的dataMatrix 和后面得到的 exprSet 都是我们想要的表达矩阵</div>
</blockquote>
<div>## 因为你有时候获取别人处理好的表达矩阵，不符合你的normalization要求。</div>
<div>这个芯片一般是处理12个样本，从GEO里面很容易看到样品是如何分组的。</div>
<div><a href="http://www.bio-info-trainee.com/wp-content/uploads/2016/10/tmp.png"><img class="alignnone size-full wp-image-1946" src="http://www.bio-info-trainee.com/wp-content/uploads/2016/10/tmp.png" alt="tmp" width="514" height="308" /></a></div>
<div>
<div>lumi这个包甚至还提供了一个函数produceGEOSubmissionFile来直接把我们的芯片数据转换成NCBI的GEO要求的格式</div>
<div></div>
<div><strong><span style="color: #ff0000;">最后，官网链接很重要：https://support.illumina.com/array/array_kits/humanht-12_v4_expression_beadchip_kit/downloads.html </span></strong></div>
<div></div>
<div></div>
</div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/1944.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
