如果你的服务器在中国大陆,基本上就放弃prefetch啦,直接aspera即可。但是如果是在海外,就可以尝试比较prefetch和aspera下载速度。 Continue reading
余弦相似度及其生物信息学应用
众所周知,在R里面使用cor函数可以计算两个向量的相似情况,有两个参数尤为需要注意: Continue reading
有些包卸载了就回不去了(耗费三天三夜的一个bug)
最近接收到粉丝的求助,说她安装一个包data.table
失败了,提示她R包data.table
依赖于最新的4.0以上,所以被迫升级了R,结果仍然是搞不定它,又降级为3.6,折腾了三天三夜,仍然是折戟沉沙在包data.table
上面。 Continue reading
影像组学教学视频
虽然我这七年在生信技能树、生信菜鸟团、单细胞天地写了几万篇教程,制作了几百个小时的教学实战演练视频课程,都是免费分享在各大网站(B站,知乎,简书,博客,GitHub,微云),但我也并不是什么都会,比如蛋白质组和代谢组以及宏基因组我就没有机会去尝试,必然就不可能制作它们的数据处理视频。凡是我会的,录制了视频的,都会组建好交流群,见: Continue reading
引出你的课题聚焦的基因-差异和生存
大家很容易陷入一种误解,数据挖掘就是要去灌水,发SCI文章。其实真正是数据挖掘,是高效的利用好已有的科研成果,避免重复性的设计实验浪费纳税人民的钱。 Continue reading
引出你的课题聚焦的基因-差异和生存
大家很容易陷入一种误解,数据挖掘就是要去灌水,发SCI文章。其实真正是数据挖掘,是高效的利用好已有的科研成果,避免重复性的设计实验浪费纳税人民的钱。 Continue reading
一个小目标
凡是我会的生物信息学数据分析技能,都录制了视频的,而且组建好交流群,见:
也不知道推荐啥,反正就送五本书
不知不觉我们生信技能树的每月赠送活动也走过了两个年头,首先感谢图灵出版社的始终如一的支持,然后感谢生信技能树几位负责的小编接力完成了粉丝挑选,活动策划: Continue reading
学徒作业-hisat2+stringtie+ballgown流程
十多年前的普通转录组一个样品测序跟现在的单细胞转录组类似,成本也是一两万块钱,然后随便五六个样本分两组做一下差异分析,富集到通路就是一个文章。但是这些年过去了,转录组已经深入到生命科学领域的方方面面,区别是它不再是唯一的主角,现在转录组不到一千块钱一个样品,只要你有好的课题思路,好的实验设计,让转录组为你的课题增光添彩吧! Continue reading
学生信只做数据分析不做湿实验发不了高分文章吗
分享一个粉丝来信:
敬爱的曾老师: Continue reading
芯片探针到基因组区段坐标的映射
最近接到粉丝求助,有一篇文献写到:We found that 16 differentially expressed genes (Table 2) represented by specific probe sets (‘_at’ suffix) mapped to previously reported linkage peaks on chromosomes 1p34, 5q12, 9q22, 9q34, 13q32, 14q32, and 20q13. Continue reading
我是如何发现850K甲基化芯片和EPIC的区别
有粉丝求助,她做850K甲基化芯片数据处理的时候,使用champ流程,然后报错非常诡异,是Failed CpG Fraction,各种查资料都无法解决,我让她复制粘贴报错的关键信息,如下: Continue reading
为什么R4.0版本内置的R包那么多
因为最近自己购置了一个全新的Windows电脑,所以就系统性的配置了全部的生物信息学相关软件,当然是也包括R语言啦,毕竟我一直强调生物信息学数据分析学习过程的计算机基础知识,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理: Continue reading
为何cytoscape总是说我没有java呢
做数据挖掘的朋友们都懂,cytoscape的出镜率非常高,主要是因为太多人对R语言的掌握程度不好,所以只能是借助cytoscape这样的可视化软件,cytoscape是java语言开发的,也有很多人在cytoscape的基础上面开发插件,而且有一些插件就可以单独发表SCI文章,有点类似于在R语言的平台上面开发R包就可以发文章一样。 Continue reading
外显子测序被Science评为年度十大突破的时候你在做什么
科研热点就是这样,两三年就换一批,抢热点大概率上就是摘那些低垂的果实。
相信大家这两年都见证了单细胞测序的火爆, 不管是紧锣密鼓的CNS文章,还是雨后春笋般的培训班。单细胞的光环太多了: Continue reading
探索lncRNA表达量的组织特异性
前面我们布置了学徒任务,复现一下DNA甲基化的组织特异性,见:学徒任务-探索DNA甲基化的组织特异性 。同样的,其它分子,肯定也会有组织特异性,比如lncRNA。发表在Comput Math Methods Med. 2019的文章:Portrait of Tissue-Specific Coexpression Networks of Noncoding RNAs (miRNA and lncRNA) and mRNAs in Normal Tissues 就统性探索了lncRNA表达量的组织特异性。 Continue reading
探索DNA甲基化的组织特异性
表观调控领域关于DNA甲基化的研究绝对是一个热点,尤其是有那么多的技术,WGBS,RRBS,450K/850K芯片。早在2014年发表于Genome Biology 的文章:DNA methylome profiling of human tissues identifies global and tissue-specific methylation patterns 就设计实验系统性探索了 DNA甲基化的组织特异性。 Continue reading
数据挖掘课程第四期学员反馈
在数据挖掘课程研发的早期(2020开春,疫情期间),我们就有预感,它会成为医学生/临床医师首选技能提高课,诚意满满的3周马拉松式授课,第一期就收到了非常棒的评价,见:数据挖掘第一期学习反馈,一个季度过去了,第四期数据挖掘课程也顺利落幕,同样的有学员乐于跟大家分享她参加学习班的心得体会,我相信对你也会有所触动。 Continue reading
数据挖掘学习笔记
在数据挖掘课程研发的早期(2020开春,疫情期间),我们就有预感,它会成为医学生/临床医师首选技能提高课,诚意满满的3周马拉松式授课,第一期就收到了非常棒的评价,见:数据挖掘第一期学习反馈,一个季度过去了,第四期数据挖掘课程也顺利落幕,同样的有学员乐于跟大家分享她参加学习班的笔记和心得体会,如果你看完后觉得有必要,可以考虑一下我们生信技能树举办的最适合医学生/临床医师的数据挖掘课程,8月3号新的一期起航,希望有你!招生宣传见:数据挖掘学习班第5期(线上直播3周,马拉松式陪伴,带你入门),原价4800的数据挖掘全套课程, 疫情期间半价即可抢购。 Continue reading
生物信息学Topic论文投稿指南(计算表观遗传方向)
本次Topic重点关注表观遗传大数据分析以及表观遗传和遗传数据的整合分析。如果你还不是很了解多组学数据分析,建议看看生信技能树的B站系列免费教学视频哈,见: Continue reading