看到朋友圈很多人转发一篇研究,至少4个公众号跟踪报导分享了,我也简单阅读了一下,说说自己的感受哈!
肿瘤外显子视频课程小作业
外显子技术是仅次于转录组的热门 NGS 应用,尤其是在肿瘤研究方向,大量的癌症多组学队列其实就是转录组加上外显子而已。实际上并没有专门的肿瘤转录组教程系列,但是肿瘤外显子却不然,如果大家三年前追过我的直播基因组活动,就应该知道同样是DNA层面的测序,全基因组,外显子组还有捕获基因靶向测序,在肿瘤研究里面不仅仅是找跟参考基因组不一样的位点,就是所谓的变异位点而已。 Continue reading
中山的西湖大学你来吗
2019年2月,在中山市第十五届人民代表大会第六次会议上,“积极筹建中山科技大学”的内容被写进了政府工作报告。同年12月19日,中山科技大学筹建办揭牌成立。
投入百亿,2025年建成新型研究型大学 Continue reading
在R里面修改染色体顺序真麻烦
使用下面的代码模拟数据 Continue reading
在一群临床医师面前分享生物信息学在肿瘤血研究的应用
这周六,应多年好友罗鹏之邀来到《第四届南方肿瘤精准治疗论坛》做了一个分享,因为早早被告知听众都是临床医师,所以我特意把分享的形式通俗化,并不需要具备生物信息学基础知识也可以获得一些认知。 Continue reading
在感恩节官宣
前些天我们在你都不感谢我凭什么要求我帮你宣传:有奖征集了发文章的规范化致谢格式!
考虑到投稿参与评选的人不多,而且时间也到了,我们直接就公布一等奖吧,由生信技能树VIP交流群-会咋眼的鱼获得,奖金2000元! Continue reading
有些R包是你的电脑操作系统缺东西
我们说到过,安装R包基本上是缺啥就安装啥即可,但是总有一些让你头疼的,比如我们介绍过在Ubuntu安装单细胞的3大R包,就非常精彩,视频在:https://www.bilibili.com/video/av63988858 Continue reading
有趣的基因命名
gene symbol 是非常官方的,由HUGO 组织负责维护,有专门的数据库HGNC database of human gene names | HUGO
以前分析数据的时候,有一些基因的symbol很奇怪,让我百思不得其解,比如: Continue reading
一个R考核题-多个芯片平台的探针序列输出到fasta文件
有一个数据框,第一列是探针ID,第二列是探针的碱基序列,第三列是芯片平台,模拟数据代码如下: Continue reading
一个加州大学洛杉矶分校生物信息学博士要离开科研圈
不知道大家是否还记得几年前我翻译和传播的一个新闻:一个MIT的博士要离开学术圈,结果······ 原作者的题目是:再见吧,我的学术生涯! 评论区众说纷纭,也确实给大家了一些启发。现在是2020年的第2天,我在朋友圈看到另外一个类似的故事,因为主人公是中国人所以会让我们更加有代入感,关键是不需要翻译,传递出原汁原味的人生感悟。希望能对正处于人生关键抉择路口的你有帮助。 Continue reading
眼馋Y叔的可视化函数却还想使用DAVID结果肿么办
昨天宣传了Y叔的clusterProfiler包之让人眼花缭乱的可视化炫技,见:为R包写一本书(向Y叔致敬) 。有趣的是粉丝留言提到:Y叔的图必须以富集出来的对象,比如enrichKK来画,如果是自己准备数据框的话,就不行,不知道作者有没有好的建议? Continue reading
芯片探针ID的基因注释以前很麻烦
最近在答疑群里收到一个很经典的提问,就是:
- 请问各位老师,GPL570芯片中应该有部分基因是LncRNA,能否通过基因重注释的方式把有意义的LncRNA筛选出来呢?R语言能否实现呢? Continue reading
芯片探针序列的基因注释已经无需你自己亲自做了
在整个生信技能树的历史上,就分享过两次价值一千元的:
为什么gpl信息里面的物种会错误呢
最近在对GEO数据库的全部GPL平台的芯片探针序列进行批量重新注释的时候,发现如果工具芯片自带的物种信息来自动化选择参考基因组,居然还会出现某个芯片探针比对率非常低的情况, 比如GPL21827这个平台: Continue reading
为什么肿瘤细胞具有病人异质性但是细胞系没有
在回顾2014的science关于GBM的单细胞转录组文章,DOI: 10.1126/science.1254257 标题是; Single-cell RNA-seq highlights intratumoral heterogeneity in primary glioblastoma 在附件看到了一幅我当时忽略的图。我发现肿瘤细胞具有病人异质性但是细胞系没有: Continue reading
为什么不用TCGA数据库来看感兴趣基因的生存情况
为R包写一本书(像Y叔致敬)
最近收到粉丝求助,本来是询问富集分析的时候,我给的参考代码,为什么pvaluecutoff值和qvaluecutoff值设到0.9,其实是怕大家富集不到结果。然后Y叔在自己的微信公众号中提到“富集不到结果才是正确的结果”,采用了更加稳妥和可靠的方法来判断富集结果,而粉丝的数据在DAVID中能有结果,可在Y叔的包里,结果就少了一些,如何决定采取哪个?最后又讨论到DAVID结果可视化,网上资源少,他只能做成条图,需要我给指条方向! Continue reading
探讨生物信息学本科教育
因为我们生信技能树的名声在外,很多以前一起探讨生物信息学数据分析技巧的朋友都陆陆续续博士毕业成为了各大高校的青椒(听说是比较凄惨的)了,也有很多朋友本来就是经验丰富的生物信息学本科专业班主任,推荐了不少学生关注我们生信技能树。 Continue reading
使用R包判定CRC稳定的分子亚型
前面我们在生信技能树公众号系统性总结分享过:CRC稳定的分子分型,没有背景知识的朋友可以去深入读文献:October 2015 The consensus molecular subtypes of colorectal cancer。 Continue reading
使用平均值替换NA
最近学徒群在讨论一个需求,就是用数据框的每一列的平均数替换每一列的NA值。但是问题的提出者自己的代码是错的,如下: Continue reading