一 17

数据下载碰到的问题的小总结

Posted on 2020年1月17日 by ulwvfje

全国巡讲南京站过去还不到一周，学员们课后练习都很拼，微信群答疑对话一不留神就几百条了，爱学习的你是最美丽的！
恰好看到一个学员开始主动思考，自行摸索，超出我们授课范围的知识点整理，主动投稿，下面请大家欣赏一下南京站学员分享： Continue reading →

一 17

每月一生信流程之rnaseqDTU

Posted on 2020年1月17日 by ulwvfje

每月一生信流程栏目灵感来自于《铁汉1991》博客的《每日一生信》，他那个时候介绍的主要是生信基础知识，包括数据结构，数据格式，数据库资源，计算机基础等等，所以每天都可以进步，每天都有成果。这些基础知识已经被分享的七七八八了，所以我这里推陈出新，来一个每月一生信流程，陪生信技能树的粉丝们一起进步！ Continue reading →

一 17

每月一生信流程之RNAseq123

Posted on 2020年1月17日 by ulwvfje

目前bioconductor社区有27个流程，早在2015/2016年我组织生信菜鸟团小伙伴建设bioconductor中文社区的时候就想系统性的学习和分享，一晃四五年过去了，我们的bioconductor中文社区只有一个空荡荡的主页，我自己的几个笔记而已，很可惜没有能坚持下去，不过现在有数十万粉丝了，这些资料必须得强推给大家，系统性学习生物信息学的宝藏资源！ Continue reading →

一 17

每月一生信流程之maEndToEnd（传统的表达芯片技术数据就应该怎么处理）

Posted on 2020年1月17日 by ulwvfje

一 17

没有生物学背景的数据分析很危险

Posted on 2020年1月17日 by ulwvfje

前些天我在介绍GEO数据挖掘技术应用到RNA-seq数据分析的推文：GEO数据挖掘技术可以应用到表达芯片也可以是转录组测序布置了一个作业：下载到GSE106292 数据集的 Excel表格如何读入R里面，做出作者文章的那样的图，可以参考关键问题答疑： Continue reading →

一 17

3种方法注释你的甲基化探针

Posted on 2020年1月17日 by ulwvfje

关于表达芯片的公共数据库挖掘我这边以及差不多把改写的推文在2年前就写完了，但表达芯片毕竟只占芯片市场的半壁江山，还有大量的非表达芯片，比如大名鼎鼎的甲基化芯片。关于甲基化，我们公众号教程非常少，主要是因为我本人在短暂的6年生物信息学工作经验中并没有实际负责过这样的项目，而我们公众号90%教程都是我写的，极少的投稿里面，只有 [850K甲基化芯片数据的分析] Continue reading →

一 17

计算wes数据全部外显子的平均测序深度

Posted on 2020年1月17日 by ulwvfje

如果学徒之后跑流程，那其实前途很有限，所以我安排了一个随机任务，考核他们查资料解决问题的能力。我在Published: 04 April 2012 文章， The clonal and mutational evolution spectrum of primary triple-negative breast cancers 看到了一个有趣的图。 Continue reading →

一 17

基于star比对工具的单细胞转录组数据可变剪切流程来啦

Posted on 2020年1月17日 by ulwvfje

前些天我在生信技能树介绍过star-fusion：最好用的融合基因查找工具终于正式发表了，然后在另外一个教程：一个好像没有做任何改变的参数提到了目前大量的单细胞转录组数据出来了，却没有一个文章去探索融合基因，也没有人开发工具，是一个空白市场，大家可以试试看哦。虽然商业化很成功的10X仪器做单细胞其实找融合基因还是有点勉强的，毕竟它并不是转录组全长测序，所以基本上很难获得融合位点融合事件，不过，如果是smart-seq2技术实际上是可以的啊！ Continue reading →

一 17

基于bam文件做可变剪切的软件leafcutter和rMATS的比较

Posted on 2020年1月17日 by ulwvfje

基于fastq测序数据可以做可变剪切，比如bioconductor流程rnaseqDTU 就说明了salmon软件和R包打配合，不过大多数情况下，我们其实已经采用了star或者hisat2软件对fastq测序数据根据参考文件已经进行了比对，这一个步骤非常耗时，所以我们做可变剪切理论上应该是从bam文件开始，省时省力哈！ Continue reading →

一 17

发NC了不起吗

Posted on 2020年1月17日 by ulwvfje

刚才某上海地区的粉丝突然发信“责问”我为什么没有发他们课题组成果的宣传稿，我表示“一脸懵逼”，想起来原来是前些天他也是这样“随意”委托过我，说课题组刚刚发了一篇nature communications，其它公众号bioart，测序中国等等都会跟进报道宣传，“希望”我们生信技能树也同步宣传。 Continue reading →

一 17

多个探针对应同一个基因取最大值的代码进化历史

Posted on 2020年1月17日 by ulwvfje

我的GEO芯片数据分析教程本来就是为粉丝写的，基本上就是生信菜鸟团QQ群的诸位问什么，我就临时搜索整理讲解那个知识点，非常融洽，目录如下： Continue reading →

一 17

对表型数据框进行去冗余

Posted on 2020年1月17日 by ulwvfje

上次GEO课程回答了学员问题：使用R语言在向量的任何位置插入任何元素实力演示了如何自定义函数，这样大家就可以无限制创造方法来解决自己特殊的需求，课后一个月的答疑期，发现大家还是有各式各样的问题，比如下面的表型信息： Continue reading →

一 17

第一期单细胞视频笔记汇总

Posted on 2020年1月17日 by ulwvfje

一 17

到底是批次效应还是真实生物学差异

Posted on 2020年1月17日 by ulwvfje

因为10X仪器的商业化成功，目前大家的单细胞转录组课题基本上都是10X数据，所以我在单细胞天地分享了一系列相关教程，希望可以接地气的帮助大家，如下： Continue reading →

一 17

当年被拒稿的bowtie如今获得近1.5万的引用

Posted on 2020年1月17日 by ulwvfje

做生物信息学的我们很难不认识bwa和bowtie了，可以说是短序列（reads，NGS测序片段）比对领域第一第二了，在Twitter看到一个有趣的讨论，关于bowtie当年被拒稿： Continue reading →

一 17

单细胞至少得培训3天及以上

Posted on 2020年1月17日 by ulwvfje

单细胞成为了科研热点，是毋庸置疑的，所以很多商业培训机构跟风开始举办各式各样的培训班，粗略看了下课表，简直~~~ Continue reading →

一 17

不同矫正批次效应方法的比较

Posted on 2020年1月17日 by ulwvfje

前面我在生信技能树推文：你确定你的差异基因找对了吗？提出了文章的转录组数据的60个样品并没有按照毒品上瘾与否这个表型来区分，而是不同人之间的异质性非常高，这个时候我提出来了一个解决方案，就是理论上就可以把人当做是一个批次效应，使用北京大学李程课题组开发的sva包的combat函数，把这样的效应去除一下，接着再找差异。 Continue reading →

一 17

安装GitHub的R包困难解决方案

Posted on 2020年1月17日 by ulwvfje

相信遇到这样的问题的朋友不在少数，在中国大陆做数据分析，下载软件数据文件遇到困难那是家常便饭。
比如安装GitHub的R包，因为并不是所有的R包都会被正式的发布在CRAN或者bioconductor，所以对于简简单单分享在GitHub的R包一般我们搜索到如下代码： Continue reading →

一 17

30G的芯片数据怎么下载呢

Posted on 2020年1月17日 by ulwvfje

最近接到学徒求助，在广州，导师给了她分析cnv芯片的任务，调研文献发现，数据集很可怕，30G的芯片数据感觉下到猴年马月都不一定能成功！ Continue reading →

一 17

Untitled

Posted on 2020年1月17日 by ulwvfje

发表在免疫杂志October 2013,的文章Spatiotemporal Dynamics of Intratumoral Immune Cells Reveal the Immune Landscape in Human Cancer 根据公共数据库的 28 cell types ，定下来了 Five hundred seventy-seven cell-type-specific genes (681 Affymetrix probes) 。 Continue reading →

生信菜鸟团

欢迎去论坛biotrainee.com留言参与讨论，或者关注同名微信公众号biotrainee

Daily Archives: 2020年1月17日

数据下载碰到的问题的小总结

每月一生信流程之rnaseqDTU

每月一生信流程之RNAseq123

每月一生信流程之maEndToEnd（传统的表达芯片技术数据就应该怎么处理）

没有生物学背景的数据分析很危险

3种方法注释你的甲基化探针

计算wes数据全部外显子的平均测序深度

基于star比对工具的单细胞转录组数据可变剪切流程来啦

基于bam文件做可变剪切的软件leafcutter和rMATS的比较

发NC了不起吗

多个探针对应同一个基因取最大值的代码进化历史

对表型数据框进行去冗余

第一期单细胞视频笔记汇总

到底是批次效应还是真实生物学差异

当年被拒稿的bowtie如今获得近1.5万的引用

单细胞至少得培训3天及以上

不同矫正批次效应方法的比较

安装GitHub的R包困难解决方案

30G的芯片数据怎么下载呢

Untitled

2020年1月
一	二	三	四	五	六	日
« 八				二 »
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31