<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>生信菜鸟团 &#187; 差异</title>
	<atom:link href="http://www.bio-info-trainee.com/tag/%e5%b7%ae%e5%bc%82/feed" rel="self" type="application/rss+xml" />
	<link>http://www.bio-info-trainee.com</link>
	<description>欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee</description>
	<lastBuildDate>Sat, 28 Jun 2025 14:30:13 +0000</lastBuildDate>
	<language>zh-CN</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>https://wordpress.org/?v=4.1.33</generator>
	<item>
		<title>affymetix的基因表达芯片数据差异基因分析</title>
		<link>http://www.bio-info-trainee.com/998.html</link>
		<comments>http://www.bio-info-trainee.com/998.html#comments</comments>
		<pubDate>Wed, 09 Sep 2015 15:21:27 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[未分类]]></category>
		<category><![CDATA[差异]]></category>
		<category><![CDATA[芯片]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=998</guid>
		<description><![CDATA[我主要是看了一个差异分析的教程，讲的非常详细，全面，我先简单列出这个教程，然后再 &#8230; <a href="http://www.bio-info-trainee.com/998.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<p>我主要是看了一个差异分析的教程，讲的非常详细，全面，我先简单列出这个教程，然后再贴出我的代码</p>
<div>GEO本来只有三种层级的数据，分别是Sample, Platform, and Series</div>
<div>
<div>现在共有14,927 platforms，包括主流的affymetrix，agilent，illumina等产商的芯片，以及它们在不同领域的应用（snp，snv，gwas等等），以及各种不同的生物体（人，小鼠，大鼠）</div>
<div>这个分析流程，仅仅针对于affymetrix公司的基因表达相关的芯片数据。</div>
<div>
<div>目录如下：</div>
<div><a href="http://helloxxxxxx.blog.163.com/blog/static/216015095201312653134662/" target="_blank">基因芯片（Affymetrix）分析1：芯片质量分析</a><br />
<a href="http://helloxxxxxx.blog.163.com/blog/static/216015095201312851632643/" target="_blank">基因芯片（Affymetrix）分析2：芯片数据预处理</a><br />
<a href="http://helloxxxxxx.blog.163.com/blog/static/21601509520132653218840/" target="_blank">基因芯片（Affymetrix）分析3：获取差异表达基因</a><br />
<a href="http://helloxxxxxx.blog.163.com/blog/static/216015095201321514655905/" target="_blank">基因芯片（Affymetrix）分析4：GO和KEGG分析</a><br />
<a href="http://helloxxxxxx.blog.163.com/blog/static/216015095201322683815364/" target="_blank">基因芯片（Affymetrix）分析5：聚类分析</a></div>
<div>因为他也是转载，所以链接失效了，现在的链接如下：</div>
<div><a href="http://seuzsl.blog.163.com/blog/static/2187980520134910258605/">http://seuzsl.blog.163.com/blog/static/2187980520134910258605/</a></div>
<div><a href="http://seuzsl.blog.163.com/blog/static/2187980520134910339429/">http://seuzsl.blog.163.com/blog/static/2187980520134910339429/</a></div>
<div><a href="http://seuzsl.blog.163.com/blog/static/2187980520134910354705/">http://seuzsl.blog.163.com/blog/static/2187980520134910354705/</a></div>
<div><a href="http://seuzsl.blog.163.com/blog/static/218798052013491049169/">http://seuzsl.blog.163.com/blog/static/218798052013491049169/</a></div>
<div><a href="http://seuzsl.blog.163.com/blog/static/2187980520134910425132/">http://seuzsl.blog.163.com/blog/static/2187980520134910425132/</a></div>
<div>其实根据目录名重新搜索肯定能得到内容的， 链接失效太正常了。</div>
<div>具体内容，我整理并且重新注释了以下，在有道云笔记里面。</div>
<div><a href="http://note.youdao.com/share/?id=e24163d717caa31265a449ba227af491&amp;type=note">http://note.youdao.com/share/?id=e24163d717caa31265a449ba227af491&amp;type=note</a></div>
<div>基本上只需要用心看这个教程，都能上手芯片数据的差异分析，但这只是差异分析的一种方法而已，而且还是非常过时的方法。</div>
<div>现在比较流行DESeq，edgeR等高通量测序的差异分析包，即使是十几年前的芯片数据，也不需要下载cel那种数据，可以直接下载每个项目的表达量矩阵<a href="ftp://ftp.ncbi.nlm.nih.gov/geo/series/GSE36nnn/GSE36138/matrix/" target="_blank">Series Matrix File(s)</a></div>
<div>然后在R里面用read.table，调整好参数就可以直接读取啦！</div>
<div></div>
</div>
</div>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/998.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
		<item>
		<title>RNA-seq流程对基因和转录本的表达量的计算</title>
		<link>http://www.bio-info-trainee.com/755.html</link>
		<comments>http://www.bio-info-trainee.com/755.html#comments</comments>
		<pubDate>Thu, 21 May 2015 07:36:24 +0000</pubDate>
		<dc:creator><![CDATA[ulwvfje]]></dc:creator>
				<category><![CDATA[转录组软件]]></category>
		<category><![CDATA[差异]]></category>
		<category><![CDATA[计数]]></category>

		<guid isPermaLink="false">http://www.bio-info-trainee.com/?p=755</guid>
		<description><![CDATA[bedtools multicov和htseq-count都可以用来对基因和转录 &#8230; <a href="http://www.bio-info-trainee.com/755.html">Continue reading <span class="meta-nav">&#8594;</span></a>]]></description>
				<content:encoded><![CDATA[<h3></h3>
<p>bedtools multicov和htseq-count都可以用来对基因和转录本的表达量的计算！！！</p>
<p>我们总共有四个样本，已经比对到小鼠的mm9基因组上面了，数据大小如下</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/RNA-seq流程对基因和转录本的表达量的计算111.png"><img class="alignnone size-full wp-image-756" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/RNA-seq流程对基因和转录本的表达量的计算111.png" alt="RNA-seq流程对基因和转录本的表达量的计算111" width="448" height="189" /></a></p>
<p>然后对基因和转录本计数需要一些额外的信息，即各个基因及转录本的位置信息，gtf文件需要在UCSC等各大数据库下载</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/RNA-seq流程对基因和转录本的表达量的计算170.png"><img class="alignnone size-full wp-image-757" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/RNA-seq流程对基因和转录本的表达量的计算170.png" alt="RNA-seq流程对基因和转录本的表达量的计算170" width="554" height="369" /></a></p>
<p>然后我们制作一个config文件配置我们的数据地址</p>
<p>cat sample_bam.config 可以看到文件内容如下</p>
<p>/data/mouse/ptan/740WT1.bam</p>
<p>/data/mouse/ptan/741WT2.bam</p>
<p>/data/mouse/ptan/742KO1.bam</p>
<p>/data/mouse/ptan/743KO2.bam</p>
<p>几个批处理文件名及内容分别如下</p>
<p>bedtools_multicov.sh  bedtools_multicov_transcript.sh  htseq.sh  htseq_transcript.sh</p>
<p>&nbsp;</p>
<p>while read id</p>
<p>do</p>
<p>echo $id</p>
<p>new=`echo $id |cut -d"/" -f 5`</p>
<p>echo $new</p>
<p>bedtools multicov -bams $id -bed /data/mouse/mouse_mm9_gene.bed  &gt; $new.gene.bedtools_multicov.count</p>
<p>done &lt;$1</p>
<p>&nbsp;</p>
<p>while read id</p>
<p>do</p>
<p>echo $id</p>
<p>new=`echo $id |cut -d"/" -f 5`</p>
<p>echo $new</p>
<p>bedtools multicov -bams $id -bed /data/mouse/mouse_mm9_transcript.bed  &gt; $new.transcript.bedtools_multicov.count</p>
<p>done &lt;$1</p>
<p>&nbsp;</p>
<p>while read id</p>
<p>do</p>
<p>echo $id</p>
<p>new=`echo $id |cut -d"/" -f 5`</p>
<p>htseq-count -f bam $id /data/mouse/Mus_musculus.NCBIM37.67.gtf.chr  &gt; $new.gene.htseq.count</p>
<p>done &lt;$1</p>
<p>&nbsp;</p>
<p>while read id</p>
<p>do</p>
<p>echo $id</p>
<p>new=`echo $id |cut -d"/" -f 5`</p>
<p>htseq-count -f bam --idattr transcript_id $id /data/mouse/Mus_musculus.NCBIM37.67.gtf.chr  &gt; $new.transcript.htseq.count</p>
<p>done &lt;$1</p>
<p>&nbsp;</p>
<p>批量运行这些程序后就能对它们分别分情况进行计数，也能比较这两种计数方法的区别！</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/RNA-seq流程对基因和转录本的表达量的计算1201.png"><img class="alignnone size-full wp-image-758" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/RNA-seq流程对基因和转录本的表达量的计算1201.png" alt="RNA-seq流程对基因和转录本的表达量的计算1201" width="553" height="246" /></a></p>
<p>&nbsp;</p>
<p>可以看出区别还是很大的！！！</p>
<p><a href="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/RNA-seq流程对基因和转录本的表达量的计算1219.png"><img class="alignnone size-full wp-image-759" src="http://www.bio-info-trainee.com/wp-content/uploads/2015/05/RNA-seq流程对基因和转录本的表达量的计算1219.png" alt="RNA-seq流程对基因和转录本的表达量的计算1219" width="553" height="253" /></a></p>
<p>我肯定没搞懂它们的原理，这完全就不一样，已经不是区别的问题了！！！</p>
<p>对于每个个体输出的计数文件，接下来就可以用DESeq等包来进行差异基因分析啦！</p>
]]></content:encoded>
			<wfw:commentRss>http://www.bio-info-trainee.com/755.html/feed</wfw:commentRss>
		<slash:comments>0</slash:comments>
		</item>
	</channel>
</rss>
