大名鼎鼎的TCGA计划回顾一下咯,关于AML研究发表在 N Engl J Med. 2013 May , 算是很厉害了,附件一百多页的PDF详尽的描述了当时的数据分析方法,而且这个研究非常受重视,仅仅是关于 它的评论就有: Continue reading
生信技能树历史推文目录-2019-01
Featured
表格如下;
2019年9月份第1周(总第81周 -BGI丢在预印本的乳腺癌单细胞转录组研究
是深圳华大基因牵头的10X单细胞转录组测序项目,本研究关注的是乳腺癌病人的肿瘤微环境
的细胞类型,尤其是免疫细胞如何作用于癌症细胞。尤其关心那些与肿瘤病人预后或者治疗情况相关的肿瘤浸润性淋巴细胞,T细胞功能障碍(也被称作耗竭)在癌症中很常见,为了更好地理解T细胞功能障碍,通常需要分析肿瘤浸润性淋巴细胞(tumor-infiltrating lymphocyte, TIL),这个时候单细胞转录组技术就派上用场了。 Continue reading
R语言练习题-初级
R语言基础知识的一些检验,最好是对照几本R基础语法书籍来理解。
全部答案及视频在:https://github.com/jmzeng1314/R_bilibili
首先做完了周末班工作, 包括软件安装以及R包安装:http://www.bio-info-trainee.com/3727.html
打开 Rstudio
告诉我它的工作目录。 Continue reading
TCGA数据库生存分析的网页工具哪家强
看自己感兴趣的基因在自己研究的癌症的预后相关性是高频需求,其实就是拿到基因在癌症病人的表达信息,然后就可以根据表达量高低对病人进行分组,最后这个分组是否统计学显著的把病人的生存情况区分开来。 Continue reading
2019年1月份第1周(总第49周)单细胞转录组探索CAFs的功能和空间异质性
癌相关的成纤维细胞 CAFs,具有异质性,是TME中的重要细胞成分,分泌的特定细胞因子、炎症趋化因子及其它可溶性因子能够诱导减缓细胞循环的过程,从而影响肿瘤细胞的增殖;2018年12月的NC文章:Spatially and functionally distinct subclasses of breast cancer-associated fibroblasts revealed by single cell RNA sequencing 使用成熟的单细胞转录组( Smart-seq2 )手段探索了癌相关的成纤维细胞 CAFs的功能和空间异质性。 Continue reading
三阴性乳腺癌表达矩阵探索(公共数据库挖掘最佳实例)
生信技能树联盟创始人jimmy手把手带你完成一个GEO数据库(GSE76275
)挖掘实例,从必备R包安装,表达矩阵下载,PCA/heatmp的数据检查,探针ID到基因ID的转换,根据生物学分组进行差异分析并且绘制火山图、热图、KEGG等数据库注释结果。 Continue reading
如何根据芯片的探针ID找到基因名-基于R语言
使用bioconductor注释包
如果该芯片平台有对应的bioconductor注释包,只有约90个常用的芯片有! Continue reading
R语言小作业-中级
首先需要完成R语言练习题-初级,在http://www.bio-info-trainee.com/3793.html
作业 1
请
根据R包org.Hs.eg.db
找到下面ensembl 基因ID 对应的基因名(symbol) Continue reading
在R里面对坐标进行映射
比如把自己制作好的bam文件的坐标,跟提取自gtf文件的坐标信息对应起来,使用GenomicRanges
包自带的函数即可。
使用refGenome加上dplyr玩转gtf文件
不是所有人都像我这样喜欢linux的黑白命令行,但是他们仍然是可以处理NGS数据的,比如最常用的gtf格式的基因组注释文件: Continue reading
把bam文件读入R,并且转为grange对象
有成熟的R包可以把bam文件读入R,比如Rsamtools,很简单的代码: Continue reading
下载芯片探针序列并且写成fasta文件
选择在GEO官网的GPL平台下载 : https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GPL21827 Continue reading
在R里面使用Rsubread完成组学分析全套流程
你是否害怕linux的黑白命令行操作,是否对去可视化畏畏缩缩,那么你会爱上它:Rsubread Continue reading
周末生物信息学培训班准备工作
第一个准备工作是安装必备软件,根据自己的操作系统选择 软件即可,(如果时间来不及,仅仅是R语言以及rstudio, 还有微信电脑版,钉钉也可以先凑合)
第二个准备工作,安装R包,代码在文末,参考(务必看完)视频 https://www.bilibili.com/video/av80872684
尽早完成准备工作,如果学有余力,就看看我们B站视频,主要是linux和R基础, https://space.bilibili.com/338686099 (不要求课前看完这些,课后可以看完它)
Continue reading
要读源代码才能解决的报错-GEOquery下载表达矩阵缺样本名
最近生信技能树的很多朋友反馈一个GEOquery的bug,而且这个错误对初学者来说,是不可能解决的问题,值得分享一下!(2018-11-27 计) Continue reading
GEOquery包的getGEO函数总是无法下载肿么办
在生信技能树我发布的GEO数据库挖掘教程也有不少了:目录: Continue reading
GTEx数据库-TCGA数据挖掘的好帮手
通常我们在挖掘TCGA数据库的时候,会发现该项目纳入的正常组织测序结果是非常少的,也就是说很多病人都不会有他的正常组织的转录组测序结果,比如说乳腺癌吧,1200个左右的转录组数据,其中1100左右都是肿瘤组织的测序数据,只有区区100个左右的正常对照。 Continue reading
多个探针对应同一个基因取最大表达量探针极简代码
这个需求实在是太常见了,很多时候我们下载的表达矩阵,都是基因的探针ID作为行名来标记, Continue reading
ATR基因增强S-G2有丝分裂检测点
保持遗传稳定性的两个关键机制包括DNA损伤修复 (调控基因组稳定性)以及有丝分裂检测点(调控染色体组稳定性)。
ATR蛋白是一个与ATM 相关的调控DNA损伤修复的主要蛋白激酶,在DNA复制过程中ATR的丢失会增加S期的基因组不稳定性并影响随后的有丝分裂。
FOXM1这个转录因子在大部分癌症是高表达的,也有文献表现它的高表达量加速了细胞分裂。 Continue reading