全国巡讲南京站过去还不到一周,学员们课后练习都很拼,微信群答疑对话一不留神就几百条了,爱学习的你是最美丽的!
恰好看到一个学员开始主动思考,自行摸索,超出我们授课范围的知识点整理,主动投稿,下面请大家欣赏一下南京站学员分享: Continue reading
Daily Archives: 2020年1月17日
每月一生信流程之rnaseqDTU
每月一生信流程栏目灵感来自于《铁汉1991》博客的《每日一生信》,他那个时候介绍的主要是生信基础知识,包括数据结构,数据格式,数据库资源,计算机基础等等,所以每天都可以进步,每天都有成果。这些基础知识已经被分享的七七八八了,所以我这里推陈出新,来一个每月一生信流程,陪生信技能树的粉丝们一起进步! Continue reading
每月一生信流程之RNAseq123
目前bioconductor社区有27个流程,早在2015/2016年我组织生信菜鸟团小伙伴建设bioconductor中文社区的时候就想系统性的学习和分享,一晃四五年过去了, 我们的bioconductor中文社区只有一个空荡荡的主页,我自己的几个笔记而已,很可惜没有能坚持下去,不过现在有数十万粉丝了,这些资料必须得强推给大家,系统性学习生物信息学的宝藏资源! Continue reading
每月一生信流程之maEndToEnd(传统的表达芯片技术数据就应该怎么处理)
每月一生信流程栏目灵感来自于《铁汉1991》博客的《每日一生信》,他那个时候介绍的主要是生信基础知识,包括数据结构,数据格式,数据库资源,计算机基础等等,所以每天都可以进步,每天都有成果。这些基础知识已经被分享的七七八八了,所以我这里推陈出新,来一个每月一生信流程,陪生信技能树的粉丝们一起进步! Continue reading
没有生物学背景的数据分析很危险
前些天我在介绍GEO数据挖掘技术应用到RNA-seq数据分析的推文:GEO数据挖掘技术可以应用到表达芯片也可以是转录组测序 布置了一个作业:下载到GSE106292 数据集的 Excel表格如何读入R里面,做出作者文章的那样的图,可以参考关键问题答疑: Continue reading
3种方法注释你的甲基化探针
关于表达芯片的公共数据库挖掘我这边以及差不多把改写的推文在2年前就写完了,但表达芯片毕竟只占芯片市场的半壁江山,还有大量的非表达芯片,比如大名鼎鼎的甲基化芯片。关于甲基化,我们公众号教程非常少,主要是因为我本人在短暂的6年生物信息学工作经验中并没有实际负责过这样的项目,而我们公众号90%教程都是我写的,极少的投稿里面,只有 [850K甲基化芯片数据的分析] Continue reading
计算wes数据全部外显子的平均测序深度
如果学徒之后跑流程,那其实前途很有限,所以我安排了一个随机任务,考核他们查资料解决问题的能力。我在Published: 04 April 2012 文章, The clonal and mutational evolution spectrum of primary triple-negative breast cancers 看到了一个有趣的图。 Continue reading
基于star比对工具的单细胞转录组数据可变剪切流程来啦
前些天我在生信技能树介绍过star-fusion:最好用的融合基因查找工具终于正式发表了 ,然后在另外一个教程:一个好像没有做任何改变的参数 提到了目前大量的单细胞转录组数据出来了,却没有一个文章去探索融合基因,也没有人开发工具,是一个空白市场,大家可以试试看哦。虽然商业化很成功的10X仪器做单细胞其实找融合基因还是有点勉强的,毕竟它并不是转录组全长测序,所以基本上很难获得融合位点融合事件,不过,如果是smart-seq2技术实际上是可以的啊! Continue reading
基于bam文件做可变剪切的软件leafcutter和rMATS的比较
基于fastq测序数据可以做可变剪切,比如bioconductor流程rnaseqDTU 就说明了salmon软件和R包打配合,不过大多数情况下,我们其实已经采用了star或者hisat2软件对fastq测序数据根据参考文件已经进行了比对,这一个步骤非常耗时,所以我们做可变剪切理论上应该是从bam文件开始,省时省力哈! Continue reading
发NC了不起吗
刚才某上海地区的粉丝突然发信“责问”我为什么没有发他们课题组成果的宣传稿,我表示“一脸懵逼”,想起来原来是前些天他也是这样“随意”委托过我,说课题组刚刚发了一篇nature communications,其它公众号bioart,测序中国等等都会跟进报道宣传,“希望”我们生信技能树也同步宣传。 Continue reading
多个探针对应同一个基因取最大值的代码进化历史
我的GEO芯片数据分析教程本来就是为粉丝写的,基本上就是生信菜鸟团QQ群的诸位问什么,我就临时搜索整理讲解那个知识点,非常融洽,目录如下: Continue reading
对表型数据框进行去冗余
上次GEO课程回答了学员问题:使用R语言在向量的任何位置插入任何元素 实力演示了如何自定义函数,这样大家就可以无限制创造方法来解决自己特殊的需求,课后一个月的答疑期,发现大家还是有各式各样的问题,比如下面的表型信息: Continue reading
第一期单细胞视频笔记汇总
到底是批次效应还是真实生物学差异
因为10X仪器的商业化成功,目前大家的单细胞转录组课题基本上都是10X数据,所以我在单细胞天地分享了一系列相关教程,希望可以接地气的帮助大家,如下: Continue reading
当年被拒稿的bowtie如今获得近1.5万的引用
做生物信息学的我们很难不认识bwa和bowtie了,可以说是短序列(reads,NGS测序片段)比对领域第一第二了,在Twitter看到一个有趣的讨论,关于bowtie当年被拒稿: Continue reading
单细胞至少得培训3天及以上
单细胞成为了科研热点,是毋庸置疑的,所以很多商业培训机构跟风开始举办各式各样的培训班,粗略看了下课表,简直~~~ Continue reading
不同矫正批次效应方法的比较
前面我在生信技能树推文:你确定你的差异基因找对了吗? 提出了文章的转录组数据的60个样品并没有按照毒品上瘾与否这个表型来区分,而是不同人之间的异质性非常高,这个时候我提出来了一个解决方案,就是理论上就可以把人当做是一个批次效应,使用北京大学李程课题组开发的sva包的combat函数,把这样的效应去除一下,接着再找差异。 Continue reading
安装GitHub的R包困难解决方案
相信遇到这样的问题的朋友不在少数,在中国大陆做数据分析,下载软件数据文件遇到困难那是家常便饭。
比如安装GitHub的R包,因为并不是所有的R包都会被正式的发布在CRAN或者bioconductor,所以对于简简单单分享在GitHub的R包一般我们搜索到如下代码: Continue reading
30G的芯片数据怎么下载呢
最近接到学徒求助,在广州,导师给了她分析cnv芯片的任务,调研文献发现,数据集很可怕,30G的芯片数据感觉下到猴年马月都不一定能成功! Continue reading
Untitled
发表在免疫杂志October 2013,的文章Spatiotemporal Dynamics of Intratumoral Immune Cells Reveal the Immune Landscape in Human Cancer 根据公共数据库的 28 cell types ,定下来了 Five hundred seventy-seven cell-type-specific genes (681 Affymetrix probes) 。 Continue reading