singleR的7个数据库文件下载失败

singleR是目前单细胞转录组领域算是比较出众的自动化细胞类型注释系统,所以我分享的两个祖传代码里面都加上了它,成为标准流程:

singleR自带7个数据库文件,需要联网才能下载,其中5个是人类数据,2个是小鼠的数据:

  • BlueprintEncodeData Labels
  • HumanPrimaryCellAtlasData Labels
  • DatabaseImmuneCellExpressionData Labels
  • NovershternHematopoieticData Labels
  • MonacoImmuneData Labels
  • ImmGenData Labels
  • MouseRNAseqData Labels

联网下载不同数据库文件的代码是:

library(SingleR)
cg=BlueprintEncodeData()
cg=DatabaseImmuneCellExpressionData()
cg=NovershternHematopoieticData()
cg=MonacoImmuneData()
cg=ImmGenData()
cg=MouseRNAseqData()
cg=HumanPrimaryCellAtlasData()

就会有一个问题,中国大陆地区的部分网络其实是没办法联通singleR数据库中心,所以文件是下载失败的。收到很多粉丝求助,所以我就简单检查了一下singleR的下载数据库文件联网机制:

singleR的下载数据库文件联网机制

查看snapshotDate()函数,发现它属于AnnotationHub 包,再次查看相关函数,发现了它存放数据库文件的地址, 如下:

AnnotationHub 包文件地址

可以看到,其函数下载的数据库文件,都在这里,其实找一下8月30号的文件即可,但是我嫌弃它麻烦,就全部打包啦。上传到百度云:

链接:https://pan.baidu.com/s/1y4uJOmOjLe-vrNfw0fSi1w 
提取码:tree

如果是Windows用户的话,解压后,放在指定路径的文件夹即可

 C:\Users\win10\AppData\Local\ExperimentHub\ExperimentHub 
 # 其中 win10 需要替换成为你自己的用户名哦

然后你再次运行:

library(SingleR)
hpca.se <- HumanPrimaryCellAtlasData()
hpca.se

就会发现你已经跨越了网路障碍,可以使用singleR的各个数据库文件啦。

后来在群里大家交流的时候,发现一个更好大家解决方案,来自于我们一直强推的《生信会客厅》

《生信会客厅》的解决方案

他上传的就不是我前面的数据库文件,所以也就无需找到文件夹去替换文件。你使用他的百度云,可以拿到后缀名是RData的文件,使用方法如下:

refdata <- get(load("ref_Monaco_114s.RData"))
sce_for_SingleR <- GetAssayData(sce, slot="data")
clusters <- sce@meta.data$seurat_clusters
pred.hesc <- SingleR(test = sce_for_SingleR, ref = refdata, 
 labels = refdata$label.fine,
 #因为样本主要为免疫细胞(而不是全部细胞),因此设置为label.fine
 method = "cluster", clusters = clusters,
 #这里我们为上一步分的9个cluster注释celltype
 assay.type.test = "logcounts", assay.type.ref = "logcounts")
table(pred.hesc$labels)

云盘链接是:

链接:https://pan.baidu.com/s/13EjK-66tZKRsSl9G80S7uw 
提取码:8mfb

文件如下:

《生信会客厅》的文件夹打包

文末友情推荐

要想真正入门生物信息学建议务必购买全套书籍,一点一滴攻克计算机基础知识,书单在:什么,生信入门全套书籍仅需160
如果大家没有时间自行慢慢摸索着学习,可以考虑我们生信技能树官方举办的学习班:

如果你课题涉及到转录组,欢迎添加一对一客服:详见:你还在花三五万做一个单细胞转录组吗?

号外:生信技能树知识整理实习生招募,长期招募,也可以简单参与软件测评笔记撰写,开启你的分享人生!另外,:绝大部分生信技能树粉丝都没有机会加我微信,已经多次满了5000好友,所以我开通了一个微信好友,前100名添加我,仅需150元即可,3折优惠期机会不容错过哈。我的微信小号二维码在:0元,10小时教学视频直播《跟着百度李彦宏学习肿瘤基因组测序数据分析》

Comments are closed.