<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; edgeR</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/edger/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>转录组edgeR分析差异基因</title>
		<link>http://www.bio-info-trainee.com/255.html</link>
		<comments>http://www.bio-info-trainee.com/255.html#comments</comments>
		<pubDate>Mon, 16 Mar 2015 15:06:48 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[R]]></category>
		<category><![CDATA[生信组学技术]]></category>
		<category><![CDATA[计算机基础]]></category>
		<category><![CDATA[转录组软件]]></category>
		<category><![CDATA[edgeR]]></category>
		<category><![CDATA[差异基因]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=255</guid>
		<description><![CDATA[转录组edgeR分析差异基因 edgeR是一个研究重复计数数据差异表达的Bioc &#8230; <a href="http://www.bio-info-trainee.com/255.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p style="text-align: center;"><strong>转录组edgeR分析差异基因</strong></p>
<p>edgeR是一个研究重复计数数据差异表达的Bioconductor软件包。一个过度离散的泊松模型被用于说明生物学可变性和技术可变性。经验贝叶斯方法被用于减轻跨转录本的过度离散程度，改进了推断的可靠性。该方法甚至能够用最小重复水平使用，只要至少一个表型或实验条件是重复的。该软件可能具有测序数据之外的其他应用，例如蛋白质组多肽计数数据。可用性：程序包在遵循LGPL许可证下可以从Bioconductor网站。</p>
<p><b>一：下载安装该软件</b></p>
<p>下载安装edgeR这个R包，因为这是一次讲R包的下载，我就啰嗦一点，这种生物信息学的包不同于普通的R包，是需要用biocLite来安装的，命令如下</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因304.png"><img class="alignnone size-full wp-image-256" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因304.png" alt="转录组edgeR分析差异基因304" width="543" height="250" /></a></p>
<p>&nbsp;</p>
<p><span id="more-255"></span></p>
<p>安装成功之后会有以下提示。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因515.png"><img class="alignnone size-full wp-image-257" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因515.png" alt="转录组edgeR分析差异基因515" width="533" height="272" /></a></p>
<p>但是我加载碰到一个很幼稚的错误，因为我的电脑太差了，这是一个测试的电脑，是300块钱在二手市场里面淘的，所以内存不够。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因773.png"><img class="alignnone size-full wp-image-258" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因773.png" alt="转录组edgeR分析差异基因773" width="517" height="109" /></a></p>
<p>我简单搜索了一下，才知道是虚拟内存太小了，需要调整</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因997.png"><img class="alignnone size-full wp-image-259" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因997.png" alt="转录组edgeR分析差异基因997" width="419" height="497" /></a></p>
<p>重启电脑，就成功啦</p>
<p><b>二：准备数据</b></p>
<p><b>就是</b>对tophat的bam文件用HTseq计数后的count文件，见前一篇文章</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组HTseq对基因表达量进行计数2709.png"><img class="alignnone size-full wp-image-252" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组HTseq对基因表达量进行计数2709.png" alt="转录组HTseq对基因表达量进行计数2709" width="203" height="45" /></a></p>
<p><a href="http://www.bio-info-trainee.com/?p=244">http://www.bio-info-trainee.com/?p=244</a></p>
<p>&nbsp;</p>
<p><b>三：运行命令</b></p>
<p><b>因为主要是在</b><b>R里面操作，我就只讲R里面的命令了，首先要把那些HTseq产生的文件拷贝到R的工作目录，我这里是自己设置了工作目录</b></p>
<p><b>setwd("D:\\项目\\RNA-seq\\htseq")</b></p>
<p><b>a=read.table("case1.sam.count")</b></p>
<p><b>b=read.table("case2.sam.count")</b></p>
<p><b>c=read.table("control.sam.count")</b></p>
<p><b>counts=data.frame(case1=a[,2],case2=b[,2],control=c[,2])</b></p>
<p><b>rownames(counts)=a[,1]</b></p>
<p><b>这样就读入了一个counts数据框</b></p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因1845.png"><img class="alignnone size-full wp-image-261" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因1845.png" alt="转录组edgeR分析差异基因1845" width="198" height="140" /></a></p>
<p>可以看到有三个样本，涉及到了23373个基因，每个样本的测序量约50M的reads</p>
<p>可以看到，有很多基因的计数不到30次。</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因2085.png"><img class="alignnone size-full wp-image-262" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因2085.png" alt="转录组edgeR分析差异基因2085" width="740" height="94" /></a></p>
<p>我们首先对第一组来选择差异基因</p>
<p>case1_control=counts[,1:2]；group=c("case1","control")；</p>
<p>cds &lt;- DGEList( case1_control, group = group )</p>
<p>简单看看这个构造的对象cds的具体内容</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因2442.png"><img class="alignnone size-full wp-image-263" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/03/转录组edgeR分析差异基因2442.png" alt="转录组edgeR分析差异基因2442" width="300" height="483" /></a></p>
<p><b>四：输出文件解读</b></p>
<p><b>呀，好像运行错误了，好像这个说明书太长了，希望有人跟我一起读读，总共</b><b>78页的PDF文件，</b><b>我明天再弄弄！</b></p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/255.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
