暑假前的优秀本科生数据挖掘毕业设计课题辅导活动, 已经带领了近100多名优秀本科毕生了解生物信息学,并且完成了相关毕业设计,见:这120万我就不要了,送给500名优秀本科生,看到朋友圈的那些小朋友相继开启毕业照朋友圈刷屏模式,甚是欣慰。 Continue reading
五分钟搞定你的个人博客
因为众所周知的原因,大家在简书等平台分享自己的学习笔记经常会受限,包括莫名其妙的被删帖或者一段时间无法发帖,在其它平台包括CSDN,博客园,知乎也是如此,严苛的内容审查机制和防止外链的限制特别影响大家的发挥。 Continue reading
为什么不打折呢
这不618大促嘛,很多粉丝后台问我:期待我们的生信爆款入门学习班好久了,能不能在618大促打折搞活动啊!
为难你了,选择生信技能树
最近有粉丝发邮件咨询我单细胞问题的时候,我指出来其实是因为他R语言知识不牢固,所以没办法从特定的S4对象里面提取内容,转录组基础也没有学习所以不明白文库是什么,其实就是说并不是单细胞本身知识点问题,所以推荐他去听我B站的全网第一个单细胞课程(免费基础课程),过两天他回信说太感谢我的教程了,之前确实是基础知识不够所以单细胞数据分析的很勉强,一步一个坑。 Continue reading
同样的的单细胞研究,为什么发表的文章杂志等级差别那么大
新冠疫情期间,关于COVID-19病毒感染病人的单细胞研究很多,我看到《单细胞天地》解读了:COVID-19病人支气管免疫细胞单细胞测序分析,文章信息如下: Continue reading
使用SnpSift把vcf文件的变异位点注释到clinvar数据库
号外:生信技能树知识整理实习生招募,长期通知,也可以简单参与软件测评笔记撰写,开启你的分享人生!
遗传变异的数据库注释非常简单,就是从数据库里面下载记录文件,然后根据坐标对应一下即可,甚至很多成熟的工具都可以自动下载数据库以及比对,就跟我们前面讲到的把vcf文件注释到dbSNP数据库的ID一样简单。我在多年前的直播我的基因组讲过很多了: Continue reading
生信技能树知识整理实习生招募
在生信技能树,生信菜鸟团,单细胞天地分享了超1.3万篇教程后,越来越感觉时间与精力不够用,且不说每日都要维持多个公众号的教程原创笔记撰写,仅仅是把这些教程发布出去,都是不小的工作量。目前我的教程同步更新在知乎,博客,腾讯云社区,简书,B站,论坛等平台,而且还有二十多个微信学习交流群需要维护,见: Continue reading
生信技能树视频号诚邀您关注
我其实非常犹豫,是否应该把生信技能树视频号推荐给大家,并不是因为里面的内容不够丰富,也不是说视频号这样的短视频模式不适合学习,主要是因为技术教程天然就赢不了娱乐视频,尤其在传播性和获取用户注意力方面。 Continue reading
生信技能树的融合基因教程系列合辑
号外:生信技能树知识整理实习生招募,长期 通知,也可以简单参与软件测评笔记撰写,开启你的分享人生!
融合基因是由染色体重排而产生的,包括染色体的易位,插入,颠倒,缺失。基因融合也在肿瘤发生发展过程起重大作用,约2成的癌症患者死亡是因为有基因融合这样的突变。基因融合广泛发生在各种各样的的癌症,而且很多基因融合事件都具有癌症种类的特异性。非常知名的有: Continue reading
生信故事会之中年大妈的自我救赎
背景介绍
坐标:湖北省会,对,就是那个全世界都在给她加油、现在仍然在喊加油的地方,上半年抗疫,下半年抗洪。 Continue reading
什么,SRA测序数据要收费了
如果大家学过我免费共享在B站上不同的数据分析视频课程,见:
什么!!!超70G的NT数据库文件一个小时搞定?
还省掉了几百块钱的会员费!!!
最近有粉丝求助,说自己已经耗费十多天了还没有把一个NT数据库下载下来,不得已充值会员费希望可以加速,但是效果也很惨淡,如下图: Continue reading
舍近求远为哪般
有粉丝提问为什么我免费共享在B站那么多不同的数据分析视频课程,见:
一波三折终于安装上了托管在GitHub的几百M的R包
以下是学员投稿,初稿发布在生信技能树公众号,见:
最近学员参考了教程: https://mp.weixin.qq.com/s/vO-3_FbjsvqfAwCsn3A7Cw 来安装ArchR,目前ArchR托管在GitHub上。
学员目标:从github上安装ArchR包,由于网速不佳,选择本地安装的方式。 Continue reading
生存分析凭什么不需要矫正P值
生存分析是大数据时代,筛选目标基因的超级有效策略。各种数据挖掘文章本质上都是要把目标基因集缩小,比如表达量矩阵通常是2万多个蛋白编码基因,不管是表达芯片还是RNA-seq测序的,采用何种程度的差异分析,最后都还有成百上千个目标基因。如果是临床队列,通常是会跟生存分析进行交集,或者多个数据集差异结果的交集,比如:多个数据集整合神器-RobustRankAggreg包 ,这样的基因集就是100个以内的数量了,但是仍然有缩小的空间,比如lasso等统计学算法,最后搞成10个左右的基因组成signature即可顺利发表。 Continue reading
你应该庆幸你的研究领域不是肿瘤
肿瘤领域的数据挖掘文章真的是“烂大街”了,一个比较成熟的分析策略很容易迁移到TCGA数据库的全部其它各种癌症研究领域。哪怕是再稀有的肿瘤,甚至肿瘤的某个稀有亚型,都是做了几十篇文章,大家可以使用一些关键词组合很容易搜索到它们。 Continue reading
这样拿差异基因集做肿瘤诊断模型不是明知故问吗
差异基因分析确实是人尽皆知了,不管是表达芯片还是RNA-seq测序拿到的表达矩阵,都可以走差异分析策略,哪怕是蛋白质组和代谢组拿到的矩阵,也是如此,其实图表没啥子区别。差异分析,火山图,热图等等标准流程,基本上读一下我在生信技能树的表达芯片的公共数据库挖掘系列推文 就明白了: Continue reading
免疫相关基因数量到底是多少个
各种数据挖掘文章本质上都是要把目标基因集缩小,比如表达量矩阵通常是2万多个蛋白编码基因,不管是表达芯片还是RNA-seq测序的,采用何种程度的差异分析,最后都还有成百上千个目标基因。如果是临床队列,通常是会跟生存分析进行交集,或者多个数据集差异结果的交集,比如:多个数据集整合神器-RobustRankAggreg包 ,这样的基因集就是100个以内的数量了,但是仍然有缩小的空间,比如lasso等统计学算法,最后搞成10个左右的基因组成signature即可顺利发表。 Continue reading
免费视频课程ATAC-seq实战演练
我这七年写了几万篇教程,制作了几百个小时的教学实战演练视频课程,都是免费分享在各大网站(B站,知乎,简书,博客,GitHub,微云),必然会出现部分教程过时,一些资料缺失(主要是链接失效)。而且很多平台都是生信技能树的各个志愿者帮忙打理,我不可能要求大家伙在辛辛苦苦帮我整理和发布资料的同时还提供答疑。比如这几天在登陆b站,就看到了这两年来积累的“铺天盖地的”留言和私信,我已经在:免费视频课程《RNA-seq数据分析》交流群组建通知 列出来了。 Continue reading
免费视频课程-chip-seq数据分析
我这七年写了几万篇教程,制作了几百个小时的教学实战演练视频课程,都是免费分享在各大网站(B站,知乎,简书,博客,GitHub,微云),必然会出现部分教程过时,一些资料缺失(主要是链接失效)。而且很多平台都是生信技能树的各个志愿者帮忙打理,我不可能要求大家伙在辛辛苦苦帮我整理和发布资料的同时还提供答疑。比如这几天在登陆b站,就看到了这两年来积累的“铺天盖地的”留言和私信,我已经在:免费视频课程《RNA-seq数据分析》交流群组建通知 列出来了。 Continue reading