听说aspera下载会失败

在国内做数据分析本来就不容易,SRA数据库自带的prefetch基本上是形如虚设,下载速度比乌龟爬行就快那么一点点,所以不得不求助IBM的aspera加速器。

首先下载软件

老规矩,conda解决一切依赖

conda install -y -c hcc aspera-cli
conda install -y -c bioconda sra-tools

然后prefetch下载数据

/SRR5907429prefetch SRR5907429

可以看到速度很可怜:

然后使用aspera加速

which ascp 
## 一定要搞清楚你的软件被conda安装在哪
ls -lh ~/miniconda3/etc/asperaweb_id_dsa.openssh l
ascp -v -k 1 -T -l 200m -i \
~/miniconda3/etc/asperaweb_id_dsa.openssh \
 dbtest@sra-download.ncbi.nlm.nih.gov:data/sracloud/traces/sra51/SRR/005768/SRR5907429 ./

其实就是解析url规律,然后构建上面的命令,需要替换的仅仅是 SRR5907429

下载速度通常是100M每秒左右

但是有趣的是被困住了。

100% 393MB - stalled -

换一个数据下载:

ascp -v -k 1 -T -l 200m -i ~/miniconda3/etc/asperaweb_id_dsa.openssh dbtest@sra-download.ncbi.nlm.nih.gov:data/sracloud/traces/sra15/SRR/001015/SRR1039513 ./

仍然是被困在,很有趣。

换一个服务器

很轻松就下载ok了。

conda create -n download
conda activate download
conda install -y -c hcc aspera-cli
conda install -y -c bioconda sra-tools

$ascp -v -k 1 -T -l 200m -i ~/miniconda3/envs/download/etc/asperaweb_id_dsa.openssh dbtest@sra-download.ncbi.nlm.nih.gov:data/sracloud/traces/sra51/SRR/005768/SRR5907429 ./
SRR5907429 100% 393MB 30.3Mb/s 01:53
Completed: 402572K bytes transferred in 114 seconds
 (28833K bits/sec), in 1 file.

很诡异哦

# 而且文件大小不一样
379M Aug 8 16:05 SRR5907429
394M Aug 8 15:57 SRR5907429

Comments are closed.