昨天我们重点强调了star这个比对软件开发团队,附带的star-fusion:最好用的融合基因查找工具终于正式发表了 因为我自己是时隔两年后再次使用它,所以很多数据库和软件代码都没有更新,中间一个小报错就浪费了四五个小时,所以分享一下这个体验! Continue reading
Daily Archives: 2020年1月17日
下载sra数据库文件不仅仅是prefetch那么简单了
最近下载一篇文章的数据,发现3个数据,就有3种结果: Continue reading
为什么清华源的R镜像恰好缺了rvest包呢
因为在中国大陆安装R包,通常是切换镜像的,我会首先推荐清华的镜像给学生们,切换镜像的代码如下: Continue reading
投稿-批量基因annotation
看到九月份学徒在群里提问,写爬虫批量循环抓取NBCI数据库的基因信息,但是经常掉线,还有可能被封,求助!
我简单指点了他去找基因数据库文件即可,随便邀请他总结投稿如下: Continue reading
虽然不知道为什么但是我可以解决这个bug
最近在调试gatk流程的时候,发现一个很有趣的问题,我使用gvcf模式的Variant Calling的代码如下: Continue reading
使用R语言在向量的任何位置插入任何元素
今天的GEO数据挖掘课程,有一个学员问到在向量的任何位置插入任何元素有没有什么简介的方法,因为她做的很麻烦,如下:
有一个向量,是100个元素,要在第34位加上一个数是56 Continue reading
生信六周年开启(南宁、南京、福州)
2019上半年我抽空在各个周六日走了十几个城市,详情见:走过了12个城市,接下来去哪里遇见你 中间几个月博士中期考核实在是太忙就暂停了全国分享的脚步。现在重启,发现继续命名为五周年可能不合适了,因为已经进入了第6年了,这次我们一次性公布3个城市的宣讲会: Continue reading
生存分析就是一个任人打扮的小姑凉
最近接到TCGA分析需求,想看看指定基因在指定癌症是否具有临床意义(也就是生存分析是否有统计学显著效果咯!)其实很早以前我在生信技能树就号召粉丝讨论过这个问题:集思广益-生存分析可以随心所欲根据表达量分组吗 这里我做实力演绎一下。 Continue reading
深入了解star-fusion结果
我们多次在生信技能树公众号介绍过star-fusion这个目前最好的针对RNA-seq测序数据找融合基因的软件:最好用的融合基因查找工具终于正式发表了 ,还有一个踩过的坑需要注意:[一个好像没有做任何改变的参数] Continue reading
如果你想分析的表达矩阵芯片全世界只有15个发表的研究
通常我们讲解GEO数据挖掘,指的是表达芯片数据处理,其中一个难点就是芯片设计的探针跟我们感兴趣的基因的对应关系,之所以说它是难点,就是背景知识太多,初学者无从了解。 Continue reading
如果传统bulk转录组数据队列足够大也可以使用单细胞流程
昨天我在生信菜鸟团分享的学徒数据挖掘任务: 不一定正确的多分组差异分析结果热图展现 提到了可以使用单细胞转录组数据分析流程来处理文献的数据集。 Continue reading
全网第一个单细胞课程虽然没有满1000份但是我也不卖了
全网第一个单细胞课程陆陆续续运营两年了,基本上大家目前看到的市面上的公司或者培训机构的单细胞相关培训材料,讲师,都是看我们的教材慢慢出师的。期间我们进行了两次预售:
前面我们分享的3天单细胞培训是有免费的配套教学视频的
上个星期我们在单细胞天地公众号推出了: 单细胞至少得培训3天及以上,如何鉴别好的培训班 非常受大家欢迎,实力避免大家踩坑,很多粉丝表示仍然是没有看出来Single cell RNA-seq data analysis with R课程全套资料在哪,其实得批评,我给了关键词 《Single cell RNA-seq data analysis with R》 Continue reading
批次效应不得不防
在最近的生信技能树推文里面我提出来了一个开放性问题 你确定你的差异基因找对了吗? 指出来了,文章的转录组数据的60个样品并没有按照毒品上瘾与否这个表型来区分,而是不同人之间的异质性非常高,这个时候我提出来了一个解决方案,就是理论上就可以把人当做是一个批次效应,使用北京大学李程课题组开发的sva包的combat函数,把这样的效应去除一下,接着再找差异。 Continue reading
跑BWA比对测试一下酷睿I9的CPU
拍卖会
因为11月23号周六到24号周日在上海,所以昨天公布了一个“义诊”的通知,响应者众多,大概收到了二十多封邮件,但是其中15个都应该批评,明知故犯,说好的需要自我介绍,课题详情,起码得300字以上吧。敷衍了事的态度让我心寒,所以剩余的粉丝不要着急,有的是时间慢慢酝酿你需要咨询的问题,而且我们名额足够,3个小时怎么着也可以诊断30个生物信息学疑难杂症啦! Continue reading
你知道吗?超1成的人类癌症跟病毒感染相关
最近看的一篇文章,提到了:Approximately 10.8% of human cancers are associated with infection by an oncogenic virus.
原文是:Oncogenes and RNA splicing of human tumor viruses Continue reading
你都不感谢我凭什么要求我帮你宣传
昨天的推文:发nature communications了不起吗 引起了不少读者的共鸣,揭露出来了社会一个比较普遍的现象,稍有成果就颐气指使,而且缺乏感恩的心态。 Continue reading
你的芯片数据结果跟已发表的完全不一致咋办
最近看的一个很有趣的文献,里面很直白的说自己的差异分析得到的基因集,跟前面两个研究的基因集,完全没有重合之处,但是作者给了比较合理的解释,所以想分享给大家。 Continue reading
你的单细胞分群数量太少可能就是因为你测的细胞数量不够
数据库构建也是生物信息学领域一个大方向,尤其是现在大热的单细胞领域,应该是不少团队在为单细胞数据库资源网页在踌躇满志了,不过单细胞数据之大,绝大部分实验室课题组是hold不住这个方向的数据这里的,最近看的一个预印本文章是:A curated database reveals trends in single-cell transcriptomics Continue reading