R来完成表达芯片分析全流程

包括如何从GEO下载数据,如何分组,两组直接如何找差异,差异基因如何去注释,包括GO/KEGG注释,还有特殊数据库,自定义数据库的注释,比如oncogene或者tumor suppress genes,TF的gene注释,还有GSEA软件的分析。
然后是对选择好的差异基因去string等PPI数据库拿到网络数据,在R或者cytoscape里面画网络图,然后是用MCODE插件和bioNet包来对网络找sub-network或者module,和hub genes。
就拿GSE42872 这个数据来做例子吧,希望听众具有基础R知识,了解什么是bioconductor,然后具有基础生物学知识,知道什么是基因,什么是表达,什么是通路,什么是富集,什么是注释。
总共10讲,每次半小时,每周3,4,6的晚上十一点开讲!
讲义的草稿如下,如果你能看懂草稿,能自己学会,就不用参加本次课程啦。
如果需要问我问题,就赶快找我申请加入交流群,提供本次培训的全套视频和代码!!!

第二讲:从GEO下载数据得到表达量矩阵     http://note.youdao.com/groupshare/?token=69C0DA517A50446B81691C557C49F48F&gid=23785548
第三讲:对表达量矩阵用GSEA软件做分析    http://note.youdao.com/groupshare/?token=DBDB0277A315444BBBAB2024190208AE&gid=23785548
第五讲:对差异基因结果做GO/KEGG超几何分布检验富集分析    http://note.youdao.com/groupshare/?token=5C72F0011F2E4CE3B11FA4981602E94D&gid=23785548
第六讲:指定基因分组boxplot指定基因list画热图    http://note.youdao.com/groupshare/?token=1711FA96897F4E60925AAAC5003DE68F&gid=23785548
第七讲:根据差异基因list获取string数据库的PPI网络数据    http://note.youdao.com/groupshare/?token=4D80DDC122474B83A02070AF1A7B61EB&gid=23785548
第八讲:PPI网络数据用R或者cytoscape画网络图    http://note.youdao.com/groupshare/?token=2C2E7AF2D4AF4B14A9BFCC4CAB03D965&gid=23785548
你会学到一些我的R使用技巧,已经GEO数据库使用心得,还有一些生物学知识。然后就是几个R包的熟悉,代码全部分享。还可以简单了解几个统计学概念,差异分析,富集分析,GSEA,注释,网络分析。最后,会略微了解cytoscape的使用!

Comments are closed.