来自于2009发表在BMC Bioinformatics 的文章:CNV-seq, a new method to detect copy number variation using high-throughput sequencing ,这篇文章的重点是说明 CNV-seq 优于aCGH 在寻找拷贝数变异方面: Continue reading
Daily Archives: 2020年4月26日
基因名很奇怪就对了
最近参加我们生信爆款入门和数据挖掘课程的学员反复咨询一个基因ID问题,就是为什么得到的结果基因名字那么奇怪(全部以LINC开头),而且ID进行转换时候,经常是50%左右的成功率,如果你也有这个疑问,那么恭喜你,看完这个教程,你肯定就懂了! Continue reading
还说啥呢,继续免费啊
隔三差五在朋友圈看到有人感叹2020开局的艰难,同一个配图每个人说的话都不一样,比如今早起来看到的某位科研服务公司工程师应该是凌晨一点发的状态: Continue reading
购买入门级服务器免费送Linux直播培训服务
疫情期间,大家很难进入实验室做实验,这段时间总不能浪费掉,除了阅读文献,学习生物信息学数据处理是一个好的选择!
作为生物信息学知识分享领域的标杆,我们生信技能树有必要做一下表率,搞一个活动吧!凡是生信技能树,生信菜鸟团,单细胞天地的粉丝,均可以去购买入门级服务器,我们就会免费送Linux直播培训服务!(钉钉群直播互动教学,限额200人) Continue reading
烦请大家不要转发这样的辣鸡资源
看到我们辛辛苦苦组建群里的各个群聊,被这样的转发领取资源的辣鸡广告污染,真的是心痛! Continue reading
多个探针对应同一个基因到底该如何取舍
前些天我发现了乳腺癌领域的PAM50算法原理探索,在:PAM50的概念及分子分型算法原理 ,其实并不难,然后我注意到他们在挑选50个基因的时候,提到了多个探针对应同一个基因到底该如何取舍。 Continue reading
对miRNA进行go和kegg等功能数据库数据库注释
如果大家对go和kegg等功能数据库注释有一定了解,就应该是知道kegg里面其实就记录各个物种不到一半的蛋白编码基因功能,比如人类, 约2万个蛋白编码基因,也就七千多个是有kegg功能注释的。其它物种就更是惨不忍睹,没有那么多科研经费投入进去,实际上对它们的基因功能就无从得知! Continue reading
底裤价转录组产品线(还送数据分析培训)
for NGS, we only do RNAseq forever
最近,我们生信技能树五年前的直播编程活动的一个优秀学员找到了我,希望可以合作, 他依托这些年在各大科研服务公司工作经历,开始创业了。创立的公司名字是钱塘生科,提出的口号是:让监督及曝光成为信任的基础,让第三方质量检测成为实实在在的行业准则。 Continue reading
单细胞转录组数据分析并不一定要过于个性化
我在 有一种生意双方都觉得亏 提到过,专业的工程师觉得为客户学习一个R包收费2000合情合理,但是委托者觉得一个项目全套分析收2000才合理。也就是说大部分情况下,大家自己的课题的个性化需求,是很难找到合适的合作者来代替你完成的,不得不学习多种多样的R包算法,而且通常是找不到交流者。 Continue reading
从基因名到GO注释一步到位
大部分的生物学高通量数据处理后都是得到基因集,不管是上调下调表达基因集,还是共表达的模块基因集,都是需要注释到生物学功能数据库来看基因集的意义,最常见的是GO/KEGG数据库啦,还有很多其它在MsigDB的,比如reactome和biocarta数据库等等。 Continue reading
3种缺失值情况需要区别对待
有过数据处理经验的你们,一定是吃过缺失值的苦头,比如相关性分析,PCA分析,Mfuzz分析,甚至绘制热图啥的,一个缺失值都让你的分析全面崩盘!如果你的表达矩阵里面的基因数量超级过部分基因缺失问题,可以把整个基因都删除,但是如果基因缺失比例很大,这个时候强行删除就会带来偏差啦! Continue reading