十二 22

不同物种的同一个基因的对应关系

不同物种的同一个基因的对应关系

我们都知道不同的物种在进化过程中其实共享很多基因的,尤其是哺乳动物,同一个基因虽然在不同的物种序列不完全一样,位于的染色体也不一样,发挥的功能可能也稍微有点区别,但是他们的相似性非常高!根据相似性就可以在不同的物种里面找到同一个基因。 Continue reading

十二 18

生信技能树论坛-生信社区版块-bioconductor中文&shiny交互网页

bioconductor中文
shiny交互网页
今天给大家介绍的是论坛的生信社区版块,包括bioconductor中文和shiny交互网页这两部分。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)

Continue reading

十二 18

生信技能树论坛-研究热点版块介绍(三)-芯片处理

今天我们继续对论坛研究热点版块进行介绍,本文是第三篇,讲的是芯片处理这个热点。本文对热点的内容简单分了下类。如果你很感兴趣,请不要错过下文这些精彩的内容哦。若你想分享自己的学习资源和学习心得,欢迎你在对应的区域发帖,帮助更多对这部分内容感兴趣的人。:)
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)

Continue reading

十二 18

生信技能树论坛-研究热点版块介绍(二)-肿瘤信息学

今天我们继续对论坛研究热点版块进行介绍,本文是第二篇,讲的是肿瘤信息学这个热点。本文分为四部分,第一部分主要介绍TCGA数据下载和整理等方面的内容;第二部分主要介绍肿瘤研究领域一些重要的知识;第三部分为一些比较实用的方法和资讯方面的内容;最后一部分为问答区。如果你很感兴趣,请不要错过下文这些精彩的内容哦。若你想分享自己的学习资源和学习心得,欢迎你在对应的区域发帖,帮助更多对这部分内容感兴趣的人。:)
Continue reading

十二 18

生信技能树论坛-研究热点版块介绍(一)

三代测序、化学信息学
免疫研究、GWAS
Meta分析、单细胞测序
进化分析、机器学习
今天我们将对论坛研究热点版块进行介绍,本文是第一篇,讲的是开篇提到的这几个热点。如果你很感兴趣,请不要错过下文这些精彩的内容哦。若你想分享自己的学习资源和学习心得,欢迎你在对应的区域发帖,帮助更多对这部分内容感兴趣的人。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)

Continue reading

十二 18

生信技能树论坛-组学大全版块-转录组&基因组

转录组
基因组
今天我们讲述的是论坛组学大全版块的转录组和基因组。这两个组学,在论坛都有很大不错的内容。比如转录组,今年暑假我们就开展了转录组入门学习活动,有很多人参与,有些朋友还在论坛留下了宝贵的笔记。这些笔记记录了每个参与者的成长过程,作为一个参与者和见证者,我非常感谢和怀念那段时光。关于基因组方面,jimmy大神有个“直播我的基因组”,非常不错。更多详情请看下文吧。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)

Continue reading

十二 18

生信技能树论坛-组学大全版块-蛋白质组&微生物组&代谢组

蛋白质组
微生物组
代谢组
今天我们将对论坛的组学大全版块进行介绍,本文讲述的是蛋白质组、微生物组以及代谢组版块。关于这部分内容,我们有实战分析,有优质笔记,以及一些文献分享,详情请看下文。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)

Continue reading

十二 18

生信技能树论坛-互动作业版块-脚本能力实践&公共资源下载&项目实战

脚本能力实践
公共资源下载
项目实战
本文主要介绍了生信技能树论坛的互动作业版块的三个部分。脚本能力实践,这部分包括perl和Python的一些入门练习题,以及其他一些脚本相关的小技巧;然后是公共资源下载和项目实战这两部分,有介绍数据下载技巧,有介绍ChIP-Seq数据分析实战的,详情请看下文。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)

Continue reading

十二 18

生信技能树论坛-在线应用-大分子表达量数据库&遗传变异资源数据库

遗传变异资源数据库

本文介绍了生信技能树论坛的在线应用版块的大分子表达量数据库遗传变异资源数据库,因为内容比较少,所以把这两个整合在一起了。内容方面,既有知识总结,又有数据库方面的介绍,还有果子大神以前遗留的待解决问题。
【真诚欢迎你】我们很多版块都需要补充和完善,如果你愿意加入我们一起建设论坛,我们非常欢迎,相信这个过程你一定能收获很多,快到碗里来吧,有能力有担当的朋友请与我们联系。:)
(2017.12.15)

Continue reading

十一 26

生信技能树论坛-组学大全板块-表观组

如果你是最近关注我们,你将又知道一个学习生信的好地方;
如果你是一直关注我们,你肯定对这个地方不陌生;
那就是我们的生信技能树论坛(附上网址:http://www.biotrainee.com/forum.php
本周我们将为大家带来生信技能树论坛-组学大全板块-表观组的介绍:

今天给大家推送:组学大全板块-表观组

作者:中科院-徐鹏

Continue reading

十一 26

生信技能树论坛的生信基础板块-可视化

如果你是最近关注我们,你将又知道一个学习生信的好地方;
如果你是一直关注我们,你肯定对这个地方不陌生;
那就是我们的生信技能树论坛(附上网址:http://www.biotrainee.com/forum.php)。。)
本周我们将为大家带来论坛-生信基础版块的介绍。

今天给大家推送:可视化版块

作者:钱胜

Continue reading

十二 15

CpG Islands记录文件下载的4种方式

这个也是读者来信最多的,关于基因组某些区域的起始终止坐标的下载问题,genomic feature的问题,一般是gtf文件或者bed文件,比如人类hg19上面的所有外显子的坐标记录文件,所有基因的坐标记录文件,所有lncRNA,rRNA等等,我这里拿CpG Islands记录文件下载的4种方式举例子给大家说明一下: Continue reading

十二 11

用R获取芯片探针与基因的对应关系三部曲-NCBI下载对应关系

这是系列文章,请先看:

用R获取芯片探针与基因的对应关系三部曲-bioconductor

ncbi现有的GPL已经过万了,但是bioconductor的芯片注释包不到一千,虽然bioconductor可以解决我们大部分的需要,比如affymetrix的95,133系列,深圳1.0st系列,HTA2.0系列,但是如果碰到比较生僻的芯片,bioconductor也不会刻意为之制作一个bioconductor的包,这时候就需要自行下载NCBI的GPL信息了,也可以通过R来解决:

##本质上是下载一个文件,读进R里面,然后解析行列式,得到芯片探针与基因的对应关系,看下面的代码,你就能理解了。 Continue reading

十二 01

吐血推荐snpedia数据库,非常丰富的snp信息记录

正好,我拿到了自己的全基因组测序数据,而前些天看到朋友圈推送的文章提到有研究表明STAT4上的rs7574865和HLA-DQ的 rs9275319是国人群中乙型肝炎病毒(HBV)相关肝细胞癌(HCC)遗传易感基因,我就想顺便看看自己在这两个位点的变异情况。一般的流程是先找完变异位点,然后用vep/snpEFF对变异位点进行注释,然后看看有没有这两个位点。但我仅仅是想查看这两个位点,所以我会根据它的rsID来找到它的基因组坐标,再直接call这个位置的变异情况。以前我都是用dnSNP来查看rsID的基因组坐标的,
mkdir -p ~/annotation/variation/human/dbSNP
cd ~/annotation/variation/human/dbSNP
## https://www.ncbi.nlm.nih.gov/projects/SNP/
## ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606_b147_GRCh38p2/
## ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606_b147_GRCh37p13/
nohup wget ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606_b147_GRCh37p13/VCF/All_20160601.vcf.gz &
wget ftp://ftp.ncbi.nih.gov/snp/organisms/human_9606_b147_GRCh37p13/VCF/All_20160601.vcf.gz.tbi

Continue reading

十一 23

用R的bioconductor里面的stringDB包来做PPI分析

PPI本质上是根据一系列感兴趣的蛋白质或者基因(可以是几百个甚至上千个)来去PPI数据库里面找到跟这系列蛋白质或者基因的相互作用关系!

本次的主角是stringDB,顾名思义用得是大名鼎鼎的string数据库,
本来还以为需要自己上传自己的基因给这个数据库去做分析,没想到他们也开发了R包,主页见: http://www.bioconductor.org/packages/release/bioc/html/STRINGdb.html 而我比较喜欢用编程来解决问题,所以就学了一下这个包,非常好用!
它只需要一个3列的data.frame,分别是logFC,p.value,gene ID,就是标准的差异分析的结果。
然后用string_db$map函数给它加上一列是 string 数据库的蛋白ID,然后用string_db$add_diff_exp_color函数给它加上一列是color。
用string_db$plot_network函数画网络图,只需要 string 数据库的蛋白ID,如果需要给蛋白标记不同的颜色,需要用string_db$post_payload来把color对应到每个蛋白,然后再画网络图。
也可以直接用get_interactions函数得到所有的PPI数据,然后写入到本地,再导入到cytoscape进行画图

Continue reading