20

都2020年了你还在用tophat吗

五年前我在生信菜鸟团博客写过一个《RNA-seq流程需要进化啦》,上面分享过:

Tophat 首次被发表已经是6年前

Cufflinks也是五年前的事情了

Star的比对速度是tophat的50倍,hisat更是star的1.2倍。

stringTie的组装速度是cufflinks的25倍,但是内存消耗却不到其一半。 Continue reading

20

甲基化芯片数据下载如何读入到R里面

数据是一切的开始,前面我们介绍了一些背景知识,主要是理解什么是DNA甲基化,为什么要检测它,以及芯片和测序两个方向的DNA甲基化检测技术。具体介绍在:甲基化的一些基础知识,也了解了甲基化芯片的一般分析流程 。既然要开始甲基化芯片数据挖掘实战,那么首先要有数据咯!需要区别的是甲基化芯片样本的idat原始文件,以及甲基化信号值矩阵。前面我们介绍了如何在GEO里面下载甲基化数据,拿到的数据文件必须要导入到R里面才能分析,现在我们就讲一下不同数据如何导入R里面。 Continue reading

20

甲基化信号值的差异分析也许不应该是看logFC

最近在系统性整理DNA甲基化相关文献,也顺便在生信技能树分享教程:

20

甲基化信号值矩阵差异分析主要图表

差异分析永远是最平易近人的策略,我们前面整理的各种系列教程,miRNA的,lncRNA的,mRNA芯片或者测序,circRNA系列的,都会得到表达矩阵,然后走差异分析。只不过是不同统计学分布的表达矩阵,后续使用不同R包而已,得到的差异分析结果的解释又取决于生物学背景,是否了解circRNA等分子。 Continue reading