为什么要做这个计算
大家都知道在真核生物里面,一个基因有多个转录本,每个转录组又是由不同的外显子组合而成,以前老旧的RNA-seq分析流程比较喜欢用RPKM值来量化表达量。大家很容易可以搜索到RPKM的公式,里面考虑到了基因长度。 Continue reading
大家都知道在真核生物里面,一个基因有多个转录本,每个转录组又是由不同的外显子组合而成,以前老旧的RNA-seq分析流程比较喜欢用RPKM值来量化表达量。大家很容易可以搜索到RPKM的公式,里面考虑到了基因长度。 Continue reading
https://github.com/mskcc/vcf2maf
安装GitHub上面的小工具 Continue reading
发表在 Nucleic Acids Research, January 2018, , https://doi.org/10.1093/nar/gkx1132 Continue reading
在《R in action》一书中提及了car包中的三个函数powerTransform(),boxTidwell(),spreadLevelPlot()来改善线性与异方差性。 Continue reading
来自于Florian的博客: https://scientificbsides.wordpress.com/ Continue reading
但很多时候,数据分析者往往身不由己。 Continue reading
先了解背景知识:http://www.bio-info-trainee.com/3263.html 并且下载数据。
再探索并且完全理解GDSC数据背景: http://www.bio-info-trainee.com/3266.html
先了解背景知识:http://www.bio-info-trainee.com/3263.html 并且下载数据 Continue reading
发表这个算法的文章是:Clinical drug response can be predicted using baseline gene expression levels and in vitro drug sensitivity in cell lines 发表时间是:Genome Biology 2014 https://doi.org/10.1186/gb-2014-15-3-r47 Continue reading
文章发表于2013年,GSVA: gene set variation analysis for microarray and RNA-Seq data 同样是broad 研究生出品,其在2005年PNAS发表的gsea已经高达1.4万的引用了,不过这个GSVA才不到300。 Continue reading
文章发表于 (2013).
“Inferring tumour purity and stromal and immune cell admixture from expression data.”
Nature Communications doi:10.1038/ncomms3612.
先浏览:ddseq单细胞转录组数据上游处理(一)
因为要处理illumina的单细胞转录组数据,所以看了看其云平台:https://basespace.illumina.com/apps
琳琅满目,简单截图如下:
文章是:Reference component analysis of single-cell transcriptomes elucidates cellular heterogeneity in human colorectal tumors. Nat Genet 2017 May;49(5):708-718. PMID: 28319088 Continue reading
下游分析其实跟产生单细胞转录组测序数据的protocol关系不大,反正都是表达矩阵,但是上游分析的表达矩阵如何获得,这个问题就很大程度上依赖于所采取的单细胞转录组技术了,是否使用spike-in,是否使用UMI, barcode策略是咋样的,等等,都需要考虑。
genefu
这个包,首先需要安装它!单细胞转录组在癌症研究领域应用价值很大,包括: