每个英雄都会变成恶龙

最近有一些“诈尸”的微信好友说我变了,不再像五六年前那样的“乐于助人”了。

确实啊,做生物信息学方向的知识整理和分享都已经是七年过去了,曾经的我是一个英雄,现在成为了恶龙,所以才会在网络上被喷子黑吧。

2013把使用过的软件分门别类

生物信息学软件啊最重要的就是4个步骤:

  • 软件安装
  • 跑示例数据
  • 把自己的输入文件做成示例数据格式也跑成功
  • 最后解读软件输出结果文件

最开始进入生物信息学领域的我深受其苦,所以自己把心得体会整理了一遍,并且分享给大家。另外还刻意去尝试不同的软件,每个软件都自己亲自使用过一遍,写下笔记,引以为傲的成就是做过生物信息学百款软件:

Web-app: webGO/David/SMS2/ExPaSy/ iPathwayGuide/
Basic: DNAman/bioEDIT/mega/clustalw/blast/blast++/fastqc/SRA-toolkit/SolexaQA/NGS-QC-toolkit/bedtools/circos/cytoscape/Emboss/ cutadapt/fastx/
Snp-calling: BWA/Bowtie2/samtools/picard/GATK/varscan/freebayes/bcftools/annovar/samStat/snpEFF/VEP/
RNA-seq: RseQC/tophat2/STAR/Hisat/htseq/cufflinks/cummedund/edgeR/DeSeq/Trinity/TransDecoder/GMAP
Evolution: muscle/figtree/PhyML/seq2HLA/Plink/
Other: LiftOver/ PICNIC/mutsig/Matlab MCR/tRNAscan-SE/FLASH/igBlast/IGV
R语言软件包:GEOquery/affy/limma/ GOstats/ConsensusClusterPlus/SPIA/ seqinr/ AnnotationHub/biostring/ GEOmetadb/biomaRt/ DawnRank

2014尝试多组学

其实我并没有其它组学课题,仅仅是因为QQ群的网友们有各种各样的需求,在我的QQ群里提问。作为群主的我也不好意思不知道,所以自己去搜索了各个国内外生物信息学资源去主动学习多组学技术:

  1. MIT课程用R进行数据处理Data Analysis for the Life Sciences

  2. 中国大学MOOC的生物信息学公开课之河南科技大学

  3. 中国大学MOOC的生物信息学之山东大学

  4. 加拿大生物信息学研讨会资源宝藏

  5. 清华大学鲁志实验室内部生物信息学培训教材
  6. 免疫生物学视频课程资源推荐(耶鲁大学+暨南大学)

  7. 加州大学圣地亚哥分校的7门生物信息学公开课(让你一次性学个够)

  8. 英国癌症中心的生信暑期学习班

  9. 跟着纽约大学NGS中心学生信

我记得当时跟初到水生所的师妹一起整理了24个资源,共享在《生信菜鸟团》的QQ群供大家学习。也是因为这样的网友求助需求,逼着我学会了各种各样的ngs组学,所以我给了自己一个响亮的光环:全网第一位全栈生信工程师,擅长的领域包括但不限于:

  • WES/RNA-seq/CHIP-seq的相关数据处理流程搭建及项目实战
  • 大型服务器的安装与维护
  • 生物信息数据处理环境搭建
  • 简单的数据处理网页工具制作

2015尝试肿瘤医学交流

2015是一个很关键的时间点,工作一年有余的我主动跳槽了,开始月薪过万了,而且进入了医药领域从事肿瘤相关研究。以前的《生信菜鸟团》的QQ群不再能满足我日常工作交流所需了,我开始组建交流群分群,从而顺理成章的过渡到了《生信技能树》这样的平台,涵盖着生物信息学的方方面面的应用。

2016尝试数据挖掘

最早开始做数据挖掘方面教程也是因为qq群,很多人问这样的那样的文献里面的图表是如何制作的,我就留意到了这个需求,因为大家提出来的文献居然是非常多类似,对我们生信工程师来说,都是超级简单的。

大约有100人响应了我的众筹活动,每个人100块钱加入听课群,我总共出了10节课:

分享的都在B站和GitHub了,目录如下:

  • 第一讲:GEO,表达芯片与R
  • 第二讲:从GEO下载数据得到表达量矩阵
  • 第三讲:对表达量矩阵用GSEA软件做分析
  • 第四讲:根据分组信息做差异分析
  • 第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析
  • 第六讲:指定基因分组boxplot指定基因list画热图
  • 第七讲:根据差异基因list获取string数据库的PPI网络数据
  • 第八讲:PPI网络数据用R或者cytoscape画网络图
  • 第九讲:网络图的子网络获取
  • 第十讲:hug genes如何找

后来有了公众号,又把这个系列教程,整理成为了表达芯片的公共数据库挖掘系列推文,感兴趣的也可以去看看;

2017-南征北战

到2017我的生信技能树已经是家喻户晓了,各种商业机会接踵而至,我去过几个大学搞小讲堂,还给一些商业机构做讲师,挣了十几万的辛苦钱。

第一次开公司,建团队,因为理念不合,草草收场。

2018变成恶龙

有了经验,恰好看到我们澳门大学对面的珠海横琴新区创业政策很好,就顺理成章开了一个小工作室,有了自己的第一个全职讲师和秘书,虽然现在都离职了。

开始招学徒,一个月的培训,一万块钱,每次培训2-3人,把自己的ngs技能前面梳理,并且把给学徒的教学过程录制成为了视频。后来有了自己的视频剪辑师,和B站运营师“卖萌哥”,就把全部的视频都免费上传到了B站,这些NGS数据处理视频课程,已经组建了微信交流群的有下面这些:

应该是从那个时候,我就不再像以前那样热心,无偿帮助一切粉丝了。毕竟有人付费来听我的课,已经是占用了我太多太多时间和精力,先不说能不能抽出空来给所有人一个举手之劳,就算我这样做了,对那些付费的小伙伴也不是很公平。

2019恶龙出游

因为录制了大量的ngs教学视频课程,也引起了全国各大高校单位生物信息学爱好者的关注,在我们《生信技能树》公众号邀请我去了他们的城市,有:

2020恶龙壮大

2019的尾巴我们还在发愁来年该如何安排30个城市的巡讲,毕竟全国各地的粉丝都迫切期待我们前往大家所在的城市一起交流生物信息学数据处理技术,没想到突如其来的的疫情让所有的脚步都停了下来。

曾经去过的北上广深杭,武汉,西安,长沙,郑州,南宁,福州,那些欢声笑语,美食文化,还萦绕在脑海。所幸科技的进步让我们交流的心并没有停止,被疫情短暂冲击了两个月后我们顺应时代的潮流,成功把我们的生信爆款入门全球听课程内容升级成为了 60个小时。

长达一个月的在线直播互动课程,也在一片掌声中坚持了一年,满满的12期,招生宣传如下所示:

期待新的英雄

很多时候,帮助你可能确实对我来说就是举手之劳,比如假如你认识我,发给我两个gse链接让我帮忙下载:

image-20210223175040126

并不会占用我很多数据,然后上传到腾讯微云或者百度传递给你。但是,如果我们没有交情,我为什么要耗费三五分钟为你做这件事呢?

再比如,我看到非常多朋友在微信朋友圈转发各种杂七杂八公众号就为了求北京大学生物信息学公开课这样的明明是完全公开的资源,我也懒得去提醒他了。

再比如,真开心一分钟赚100块钱,一个很简单的print函数技巧,如果这个粉丝并不是直接丢给我100元红包,我大概率上会被其它事情忙的昏头转向而漏掉了给他的答疑,我相信绝大部分粉丝肯定是没办法理解我的忙碌,一定要铁了心认为我就是见钱眼开。又或许,我就是这样的恶龙吧!

这样的事情,数不胜数,我能做到今天这样不费吹灰之力的解决绝大部分粉丝的求助也是一路坎坷走过来的, 走的过程就慢慢的忘记了初心,反而没办法做到不计一切代价的去帮助每一个向我求助的粉丝了。

但是,如果有新的英雄呢,比如还是本科在读的你,对生物信息学大方向还是懵懵懂懂的你,我这里有不计其数的生物信息学资源供你成为英雄。

你会考虑,走我的路吗?

欢迎留言讨论!

Comments are closed.