最近收到网友求助,问:
尝试一篇文献的表达差异分析和热图重现,主要参考您Github中GEO-master/GSE42872_main的代码,但我跑出的差异分析列表logFC与文献给出的列表数据不符,尝试了很多次,不清楚是什么原因?
本来我一般是不理会这样的求助的, 毕竟代码都给了,还不会用,总不能怪我了,冥冥中鬼使神差的回复了: Continue reading
最近收到网友求助,问:
尝试一篇文献的表达差异分析和热图重现,主要参考您Github中GEO-master/GSE42872_main的代码,但我跑出的差异分析列表logFC与文献给出的列表数据不符,尝试了很多次,不清楚是什么原因?
本来我一般是不理会这样的求助的, 毕竟代码都给了,还不会用,总不能怪我了,冥冥中鬼使神差的回复了: Continue reading
在全网最系统的表达芯片数据处理教程我没有做过多芯片注释的讲解,不过后期推文倒是很多。
实际上,很多时候,策略是没有标准的, 比如最近处理大名鼎鼎的hgu133plus2芯片: Continue reading
很久以前我们介绍过Sushi
这个R包可以绘制基因组区域reads覆盖情况,这次我们介绍另外一个功能更强大的R包 Gviz
,全称是Plotting data and annotation information along genomic coordinates 正式发表与期刊 Source Code Biol Med. 2016; 文章链接是 doi: 10.1186/s13029-016-0052-z Continue reading
相信逢年过节,大家就会看到各式各样的朋友圈笑话,比如:
做生命科学研究,尤其是医学相关课题的,很少能脱离开基因工程小鼠,也就是genetically engeenierd mouse modesl (GEMMs)
最近发现一个很有趣的现象,比如发表于 Science 05 Oct 2018 , 文章是:Reprogramming normal human epithelial tissues to a common, lethal neuroendocrine cancer lineage 的研究人员通过对基因工程小鼠,发现只要改变 5 个基因(这 5 个基因统称为 PARCB )的活性,就能让上皮健康细胞发生癌变,并发展成为小细胞癌。 Continue reading
现在10x已经是单细胞转录组领域商业首选,单个样本的结果很难满足大家的胃口,所以一次性做多个样本就成为了主流,让我们来看看多个样本数据如何整合吧。
比如发表在 Nat Med. 2018 Aug; 题目是:Phenotype molding of stromal cells in the lung tumor microenvironment. 共选取5例病人的共19个样本,通过10×genomics单细胞转录组测序探索基质细胞的亚群分类、基因功能(信号通路)、关键marker基因和临床预后。 Continue reading
大家学习到的通常是两个组的样本进行差异分析,然后走标准分析流程,火山图,热图,GO/KEGG数据库注释等等。但真实情况下,通常是有多个分组,这个时候就会有多种策略可供选择了。
比如拿某一组的样本与剩余其它组所有样本进行比较,这样的差异分析策略还是蛮流行的! Continue reading
最近安排团队学习者帮忙系统性整理单细胞肿瘤研究的3大应用方向的文献,发现里面包含一个
单细胞数据在GSE108679,大家可以下载去玩一玩,其数据分析的全部描述如下:
Continue reading
还记得几年前前准备单细胞课程作业,查遍全网基本上找不到中文资料,甚至英文文献都少得可怜,虽然那个时候单细胞就已经显现出热点的趋势,大多数CNS之作,但是在癌症领域仅仅是6个癌症类型有单细胞转录组技术应用的研究,不像现在,大量的CNS犹如雨后春笋般冒出来。
这些年陆陆续续阅读了近百篇该领域的CNS文献,所以大概总结了单细胞转录组技术肿瘤研究3大应用方向 Continue reading
记得上半年参加某个单细胞会议,深圳某医院科研负责人(院长吧)豪气的说,大家尽管来我们医院,保底50万年薪,而且咱们这里单细胞平台全部搭建好了,以后只做单细胞,所有之前使用bulk转录组的实验统统换成单细胞。 Continue reading
单细胞基础视频课程结束了,不知道大家学的怎么样,看起来线下学徒和实习生都学的挺好的,还有详细的笔记分享,考虑到大部分人是没有机会线下接受指导,有必要出一份考题督促或者提醒大家赶紧学完基础课程!全网第一个单细胞课程(基础)满一千份销量就停止发售 Continue reading
最近看到文章里面出现了单细胞转录组测序的tSNE图,如下:
看到如此巨大的细胞数量,本来以为是10X,结果仔细看文章,作者利用CyTOF技术对HCC的免疫微环境异质性进行了分析,约四百万个免疫细胞呈现出40种聚类。 Continue reading
上个月听了jimmy老师的巡讲后,开始学习GEO数据挖掘,看了相关视频后,想实战一把,于是看了jimmy老师去年开始分享的GEO数据挖掘帖子,没想到第一期就碰到个钉子,还好自己解决了,以下是分享。 Continue reading
最近在bioRxiv 预印本发现了一篇人类肺部器官单细胞研究,来自于斯坦福大学团队,发表在Aug. 27, 2019; doi: http://dx.doi.org/10.1101/742320 有约7万个单细胞数据,找到了58个细胞亚群,其中大部分是前人研究发现过的,但是有14个新亚群。 Continue reading
大家看我在生信技能树发布的各个NGS组学的视频教程, 基本都是随手找到一篇文章,就去查询其原始数据,通常是在NCBI的SRA,然后使用prefetch下载sra文件,有的时候还好使用aspera进行加速。 Continue reading
最近学徒刚刚完成了RNA-seq的训练,我就随机抽取了一个公共数据库项目给他作为作业,研究者是通过CRISPR/Cas9对 nasopharyngeal carcinoma (NPC) 细胞系的p53引入了一个杂合突变 R280T ,然后看mRNA profiles of CNE2 (control) and KO CNE2 cells 的差异。 Continue reading
转录组已经走入寻常百姓家了,现在生命科学领域实验设计搞个转录组测序就跟PCR和WB一样频繁和普及,但并不是所有人都会分析,我在全国巡讲分享生物信息学经验的时候特别指出了两个容易混淆的知识点,但大伙类似的错误认知还有不少,这里再详细讲解一个,也顺便diss一些已经发表的文章。 Continue reading
看到文章:Mol Biol Cell. 2004 Jun; 题目是:Different gene expression patterns in invasive lobular and ductal carcinomas of the breast. 使用基因芯片技术,测了 21 ILCs, 38 IDCs, two lymph node metastases, and three normal tissues 样本的表达信息,最后全文的落脚点是 ILCs 和 IDCs的差异表达情况: Continue reading
有学员问10x的3‘端测序来infer CNV 是否可靠?
这个问题,说实话,很难回答,因为要是能完整回答这个问题,其实就是一篇正经的生物信息学文章了。 Continue reading