前面我们分享了:microRNAs靶基因数据库哪家强,提到了综合了12个网页工具的miRWalk,以及整合了7个工具的miRSystem,但是最后我们仍然是推荐R包multiMiR作为提取miRNA的预测靶基因结果的解决方案,除了因为它综合了14个网页工具,而且还是这个月更新过,还有一个很大的原因是,我喜欢编程,喜欢R语言! Continue reading
使用ESTIMATE计算肿瘤的免疫得分
虽然是生物学过程很多,但是免疫的重要性毋庸置疑,大家的肿瘤研究课题最后很喜欢定位到免疫这个话题。
计算肿瘤的免疫得分的软件算法不少,其中ESTIMATE是一个还算比较容易理解的,优秀的工具,但是我发现关于它的教程非常少,而且基本上都以我多年前在生信技能树分享教程为原型:使用ESTIMATE来对转录组表达数据根据stromal和immune细胞比例估算肿瘤纯度 Continue reading
十行代码完成circRNA多种ID相互转换
科研热点层出不穷,从技术层面来看miRNA,lncRNA,circRNA,ceRNA各领风骚一两年,现在又是m6A和单细胞。前面我们在生信技能树已经系统性的总结了circRNA的相关背景知识: Continue reading
什么,给了你这么多miRNA靶基因查询R包和网页工具你居然不知道怎么使用
前面,我们多次介绍了关于miRNA的靶向基因的查询工具,分别是:
三代(PacBio/Sequel/Nanopore)细菌完成图
前面我们在 单细胞转录组数据分析大放价 (疫情期间不打烊),里面提到了因为疫情原因,一些老同事不得不身兼多职,甚至下海接项目。 Continue reading
拼凑6个网页工具图表还不够那就再加上6个组学
学TCGA数据库并不是为了发“套路”文章,那些基本上是本科生毕业设计的水准,但是阅读这样的文章的确可以很大程度上帮助大家认识TCGA数据库,主要是了解它可以做什么,比如我昨天在生信技能树介绍的:[需要5个步骤来说明你想研究的基因的重要性] Continue reading
每月一生信流程之rnaseqGene
每月一生信流程栏目灵感来自于《铁汉1991》博客的《每日一生信》,他那个时候介绍的主要是生信基础知识,包括数据结构,数据格式,数据库资源,计算机基础等等,所以每天都可以进步,每天都有成果。这些基础知识已经被分享的七七八八了,所以我这里推陈出新,来一个每月一生信流程,陪生信技能树的粉丝们一起进步! Continue reading
检查多个测序样本是否来源于同一个病人
多组学分析大行其道的今天,同一个病人我们可以对其做多次不同技术的测序,比如TCGA计划就有不下8种数据:
- DNA Sequencing
- miRNA Sequencing
- Protein Expression array
- mRNA Sequencing Continue reading
服务器被关机,不妨试试看用你的Mac电脑跑NGS流程
前面我在生信技能树提到过:没有docker我真的不想动这样的生信软件,引起了很多生信工程师的共鸣,大家基本上都在软件安装方面踩坑过,都是泪。在生信菜鸟团也有关于生物信息学环境搭建的讨论。 Continue reading
基因组分区研究(WGS和表观组学不一样)
基因组可以划分为基因区域和基因间区,其中基因区域有内含子,外显子,等等,基因间区有启动子,增强子。但是真正做完NGS测序,研究者往往会把基因组区域划分的更为细致,包括生物学功能划分。
我们这里简单介绍一下全基因组测序分区以及表观组学的分区例子,以后大家看文献的时候就需要多留意。 Continue reading
基因型的log2ratio测序深度散点图(CNV-seq 优于aCGH )
来自于2009发表在BMC Bioinformatics 的文章:CNV-seq, a new method to detect copy number variation using high-throughput sequencing ,这篇文章的重点是说明 CNV-seq 优于aCGH 在寻找拷贝数变异方面: Continue reading
基因名很奇怪就对了
最近参加我们生信爆款入门和数据挖掘课程的学员反复咨询一个基因ID问题,就是为什么得到的结果基因名字那么奇怪(全部以LINC开头),而且ID进行转换时候,经常是50%左右的成功率,如果你也有这个疑问,那么恭喜你,看完这个教程,你肯定就懂了! Continue reading
还说啥呢,继续免费啊
隔三差五在朋友圈看到有人感叹2020开局的艰难,同一个配图每个人说的话都不一样,比如今早起来看到的某位科研服务公司工程师应该是凌晨一点发的状态: Continue reading
购买入门级服务器免费送Linux直播培训服务
疫情期间,大家很难进入实验室做实验,这段时间总不能浪费掉,除了阅读文献,学习生物信息学数据处理是一个好的选择!
作为生物信息学知识分享领域的标杆,我们生信技能树有必要做一下表率,搞一个活动吧!凡是生信技能树,生信菜鸟团,单细胞天地的粉丝,均可以去购买入门级服务器,我们就会免费送Linux直播培训服务!(钉钉群直播互动教学,限额200人) Continue reading
烦请大家不要转发这样的辣鸡资源
看到我们辛辛苦苦组建群里的各个群聊,被这样的转发领取资源的辣鸡广告污染,真的是心痛! Continue reading
多个探针对应同一个基因到底该如何取舍
前些天我发现了乳腺癌领域的PAM50算法原理探索,在:PAM50的概念及分子分型算法原理 ,其实并不难,然后我注意到他们在挑选50个基因的时候,提到了多个探针对应同一个基因到底该如何取舍。 Continue reading
对miRNA进行go和kegg等功能数据库数据库注释
如果大家对go和kegg等功能数据库注释有一定了解,就应该是知道kegg里面其实就记录各个物种不到一半的蛋白编码基因功能,比如人类, 约2万个蛋白编码基因,也就七千多个是有kegg功能注释的。其它物种就更是惨不忍睹,没有那么多科研经费投入进去,实际上对它们的基因功能就无从得知! Continue reading
底裤价转录组产品线(还送数据分析培训)
for NGS, we only do RNAseq forever
最近,我们生信技能树五年前的直播编程活动的一个优秀学员找到了我,希望可以合作, 他依托这些年在各大科研服务公司工作经历,开始创业了。创立的公司名字是钱塘生科,提出的口号是:让监督及曝光成为信任的基础,让第三方质量检测成为实实在在的行业准则。 Continue reading
单细胞转录组数据分析并不一定要过于个性化
我在 有一种生意双方都觉得亏 提到过,专业的工程师觉得为客户学习一个R包收费2000合情合理,但是委托者觉得一个项目全套分析收2000才合理。也就是说大部分情况下,大家自己的课题的个性化需求,是很难找到合适的合作者来代替你完成的,不得不学习多种多样的R包算法,而且通常是找不到交流者。 Continue reading
从基因名到GO注释一步到位
大部分的生物学高通量数据处理后都是得到基因集,不管是上调下调表达基因集,还是共表达的模块基因集,都是需要注释到生物学功能数据库来看基因集的意义,最常见的是GO/KEGG数据库啦,还有很多其它在MsigDB的,比如reactome和biocarta数据库等等。 Continue reading