<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; RES</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/res/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>GSEA的统计学原理试讲</title>
		<link>http://www.bio-info-trainee.com/2102.html</link>
		<comments>http://www.bio-info-trainee.com/2102.html#comments</comments>
		<pubDate>Thu, 01 Dec 2016 16:39:21 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[基础软件]]></category>
		<category><![CDATA[生信基础]]></category>
		<category><![CDATA[ES score]]></category>
		<category><![CDATA[foldchange]]></category>
		<category><![CDATA[GSEA]]></category>
		<category><![CDATA[RES]]></category>
		<category><![CDATA[signal2noise]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=2102</guid>
		<description><![CDATA[GSEA这个java软件使用非常方便，只需要根据要求做好GCT/CLS格式的in &#8230; <a href="http://www.bio-info-trainee.com/2102.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>GSEA这个java软件使用非常方便，只需要根据要求做好GCT/CLS格式的input文件就好了。我以前也写个用法教程：</p>
<div><a href="http://www.bio-info-trainee.com/1282.html">用GSEA来做基因集富集分析</a></div>
<div><a href="http://www.bio-info-trainee.com/1334.html">批量运行GSEA，命令行版本</a></div>
<div>但说到统计学原理，就有点麻烦了，我试着用自己的思路阐释一下：</div>
<div>假设芯片或者其它测量方法测到了2万个基因，那么这两万个基因在case和control组的差异度量(六种差异度量，默认是signal 2 noise，GSEA官网有提供公式，也可以选择大家熟悉的foldchange)肯定不一样,那么根据它们的差异度量，就可以对它们进行排序，并且Z-score标准化，在下图的最底端展示的就是</div>
<p><span id="more-2102"></span></p>
<div><img class="alignnone" src="http://note.youdao.com/yws/api/group/23785548/noteresource/9ED49F972A0F4980AE784E76A7DFFC29/version/256?method=get-resource&amp;shareToken=DBDB0277A315444BBBAB2024190208AE&amp;entryId=123732909" alt="" width="503" height="504" /></div>
<div>那么图中间，就是我们每个gene set里面的基因在所有的2万个排序好基因的位置，如果gene set里面的基因集中在2万个基因的前面部分，就是在case里面富集，如果集中在后面部分，就是在control里面富集着。</div>
<div>而最上面的那个ES score的算法，大概如下：</div>
<div><a href="http://www.bio-info-trainee.com/wp-content/uploads/2016/12/1.png"><img class="alignnone  wp-image-2103" src="http://www.bio-info-trainee.com/wp-content/uploads/2016/12/1.png" alt="1" width="725" height="581" /></a></div>
<div>仔细看，其实还是能看明白的，每个基因在每个gene set里面的ES score取决于这个基因是否属于该gene set，还有就是它的差异度量，上图的差异度量就是FC（foldchange）,对每个gene set来说，所有的基因的ES score都要一个个加起来，叫做running  ES score，在加的过程中，什么时候ES score达到了最大值，就是这个gene set最终的ES score！</div>
<div>
<div>算法解读我参考的PPT，反正我是看懂了，但不一定能讲清楚：</div>
<div><a href="http://bioinformatics.mdanderson.org/MicroarrayCourse/Lectures09/gsea1_bw.pdf">http://bioinformatics.mdanderson.org/MicroarrayCourse/Lectures09/gsea1_bw.pdf</a></div>
<div><a href="https://bioinformatics.cancer.gov/sites/default/files/course_material/GSEA_Theory.pptx">https://bioinformatics.cancer.gov/sites/default/files/course_material/GSEA_Theory.pptx</a></div>
<div><a href="http://compbio.ucdenver.edu/Hunter_lab/Phang/downloads/files/GSEA.ppt">http://compbio.ucdenver.edu/Hunter_lab/Phang/downloads/files/GSEA.ppt</a></div>
<div><a href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1239896/">https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1239896/</a></div>
<div><a href="http://www.baderlab.org/CancerStemCellProject/VeroniqueVoisin/AdditionalResources/GSEA">http://www.baderlab.org/CancerStemCellProject/VeroniqueVoisin/AdditionalResources/GSEA</a></div>
<div>软件还有大把的参数可以调整：<a href="http://www.baderlab.org/CancerStemCellProject/VeroniqueVoisin/AdditionalResources/GSEA/parameters">http://www.baderlab.org/CancerStemCellProject/VeroniqueVoisin/AdditionalResources/GSEA/parameters</a></div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/2102.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
