18

ngs组学数据分析上下游之分

前些日子我们《生信技能树》的工程师做了一个ATAC-seq的项目,给客户汇报结果的时候,照例提供了全套代码。不过这次是从fq文件开始,所以大量代码都是在Linux平台的命令行而已,虽然给了客户全部的代码,但是客户直接说不想学,问有没有基于R的实现方式。 Continue reading

18

针对TCGA数据库全部的癌症的表达量矩阵批量运行 estimate

关于这个estimate,我们在生信技能树公众号已经是多次分享了,主要是因为肿瘤本身具有异质性而且肿瘤取样问题,所以我们拿到了肿瘤数据(比如表达量矩阵)里面除了恶性癌症细胞的,还有基质细胞和免疫细胞的特性。所以2013年的一个数据挖掘文章,就整理了两个基因集来根据表达量矩阵去量化肿瘤样品里面的基质细胞和免疫细胞的比例。(其实是非常的粗糙,只不过是发的比较早,所以引用很多) Continue reading