经常收到粉丝的提问,明明是按照我课程视频操作,也是按照我的代码在处理他自己的数据,但是做kegg数据库富集的时候,就是返回值为空。 Continue reading
400元每小时课时费招聘肿瘤数据挖掘讲师
朋友的教育机构新增一个业务线,暂时不需要全职讲师,所以委托我在生信技能树平台发布兼职招聘,课时费是每个小时400元。(每次32课时,项目奖金1万,学员评价奖金1万) Continue reading
sra数据库的fastq测序数据已经同步到亚马逊云了
四年前我写过介绍GEO和SRA数据库的推文 ;
RNA-seq技术的常规化应用
组会上同学分享了一篇实验生物学文章,有趣的是里面用到了RNA-seq,而且数据量不行,不过分析的点非常少,由此可以说明RNA-seq技术的常规化了。 Continue reading
R包各大镜像纷纷宕机
本来以为是写了:【紧急通知】下载R包却联网失败?初学者的痛,大家应该是不再发邮件咨询我R包安装问题,没想到的是碰到了R包各大镜像纷纷宕机! Continue reading
python和R做机器学习你选择哪个
这两天在解析cibersoft算法的时候,看到了里面的SVM,有趣的是它并不是针对分类变量的svm,所以我就去搜索了学习资料,本来我是想搜索我自己的:一文掌握SVM用法(基于R语言),但是它并不在检索引擎的优先级。 Continue reading
PAM50的概念及分子分型算法原理
众所周知,癌症具有异质性,在乳腺癌领域,不同亚型的癌症比不同器官来源癌症的差异要大很多。最简单癌症分类,当然是一个基因,比如ER阳性或者ER阴性的乳腺癌患者,并不是说人类有2万多个蛋白编码基因就可以有2万多种分类,其实在乳腺癌领域常用的分类,就是ER,HER2,PR等等,如果这3个基因都不表达,就是临床里面比较恶性的三阴性乳腺癌啦。 Continue reading
microRNAs靶基因数据库哪家强
microRNAs早就不再是科研热点,但毕竟还是遗留下来了不少数据,而且好歹是TCGA计划的多组学中的一环。在自己的研究增加miRNA的角度也是极好的, 通常大家有4个需求:
- 想知道自己感兴趣的一个或者多个miRNA有哪些靶基因
- 想知道自己感兴趣的一个或者多个基因由哪些miRNA调控
- 想知道自己感兴趣的一个或者多个miRNA跟哪些疾病或者药物相关
- 想知道自己感兴趣的一个或者多个miRNA是否调控自己感兴趣的一个或者多个基因 Continue reading
fast5和fastq格式
前面我们介绍了Oxford Nanopore Technologies(牛津纳米孔技术)公司的一些测序仪,也看到了它产出的测序数据,详见:全长转录组分析之牛津纳米孔测序介绍 Continue reading
cibersoft使用SVM算法实现去卷积
熟悉DNA测序的朋友应该是知道对肿瘤病人进行WES或者WGS等基因组测序后,可以得到成百上千的somatic突变,而这些突变都是ATCG碱基直接变化,所以它们变化的组合情况就6种,而加上上下文碱基也就96种,这96种碱基变化的比例的特殊组成,就是mutation signatures,而且COSMIC数据库上面有着30种已知的signatures,我们可以把这些signatures当做是一个有意义的生物学功能,这样一旦我们拿到自己的突变数据, 就可以通过非负矩阵分解的方法把自己的突变数据分解为这30个signatures的组合,那么如果我们拿到的是表达矩阵呢? Continue reading
CancerQuest(埃默里大学的一个癌症教育和外展项目)
有多少人做的是癌症相关研究,但其实对自己的研究对象了解很少,只是一些流行病学指标,全球各大国家地区的发病率和死亡率。所以前些天我推荐了:《高通量测序技术在肺癌领域的应用(书籍推荐)》 ,很多粉丝留言说看得非常过瘾,那就再推荐一些癌症背景知识学习资源。 Continue reading
这也怪我咯?
最近微信里“躺尸”四年的一个“好友”因为朋友圈点赞聊了几句,混的不太好,也抱怨了自己肿瘤液体活检数据分析遇到的疑难杂症在我生信技能树公众号找不到解决方案。提到了一个很新颖的观点:因为我这些年持续发布免费教程、免费视频,免费分享把这个行业利润搞低了,所以大家没有人研发高级收费课程,因为赚不到钱!而且他自己有一些想分享的经验也不好意思开课赚钱。 Continue reading
在clinicaltrials可以查询药物临床试验注册情况
最近看了一些综述,其中中国肿瘤生物治疗杂志 http://www.biother.org Chin J Cancer Biother, Jul. 2018, Vol. 25, No. 7的文献提到了研究者统计了临床试验,状态为文稿提交当天所统计(来源http://www.clinicaltrials.gov)其中免疫检查点的临床试验情况如下: Continue reading
一周内搞定基于Linux的NGS上游分析
距离公布要带500个优秀本科生入门生物信息学的活动不到一个月,虽然真正入选不到一百,但是培养成绩喜人,出勤率接近百分之百,大部分人在短短两个星期就完成了R基础知识学习,Linux认知,甚至看完了转录组实战水平,进而完成了一个自己的课题!如果你也感兴趣这个活动,那么,直达文末找到活动链接,申请加入吧! Continue reading
学徒作业-我想看为什么这几个基因的表达量相关性非常高
不知道多少人看完了全网第一个单细胞课程(免费基础课程),免费学习地址在B站:https://www.bilibili.com/video/av38741055 而且完成结业考核20题:https://mp.weixin.qq.com/s/lpoHhZqi-_ASUaIfpnX96w ,作业里面有一个头颈癌单细胞的:
课程配套资料(主要是代码和PPT)文档在:https://docs.qq.com/doc/DT2NwV0Fab3JBRUx0 Continue reading
学徒数据挖掘代码打包
其实公共数据库挖掘仅仅是你科研课题的前戏,避免你重复浪费科研经费去做一些明明可以通过分析公共数据库拿到的结论。 Continue reading
学会看IHC病理切片从HPA开始
人类蛋白图谱(Human Protein Atlas,HPA)数据库已经成为了数据挖掘标配,通常你定位到了感兴趣的有生存预后意义的基因,就会去HPA数据库看看!
比如发表在Front. Oncol., 11 September 2018 | https://doi.org/10.3389/fonc.2018.00374的文章,定位到了5个hub基因,就去HPA数据库看乳腺癌的tumor和normal组织的这些基因的比例切片情况。 Continue reading
需要5个步骤来说明你想研究的基因的重要性
大量的生物学研究都是基于单个基因,不管你是实验室祖传的明星基因还是自己通过文献积累凭感觉挑选到的基因,在完善自己的生物学故事的时候,都需要在开头加上一些引人入胜的证据来说明自己文章定位的基因的重要性。 Continue reading
下载R包却联网失败?初学者的痛
Windows电脑使用R语言有几个绕不过去的坑,就是管理员权限,中文用户名等等,所以我们开展R语言学习班,都需要重新发几次:Windows电脑使用Rstudio会有多少错误呢 ,有一个联网问题本来是疑难杂症,因为我们的讲师助教团队带了二十多场学习班才遇到过一次,也在生信技能树分享了BiocManager无法安装R包的经验,不就是修改options(download.file.method = ‘libcurl’),还需要加上options(url.method=’libcurl’)。 Continue reading
听说你想学scATAC
组学技术层出不穷,基本上都可以在单细胞水平实现,虽然大家接触的都是单细胞转录组,其实主要是因为10X仪器商业化的成功,目前10X在主攻scATAC和空间转录组解决方案,那么肯定会有人感兴趣scATAC的数据处理了。 Continue reading