linux版下载地址,并且记录下来新版的sra数据下载方式

  今日要上NCBI下载sra数据发现并未下载的链接,网上查发现都以老的措施,NCBI页面已经改变,于是看了NCBI的help,并且记录下来新版的sra数据下载格局,要用NCBI的工具SRA
Toolkit。此外咨询师兄,总计取得新的wget下载的格局。

前边一贯用wget 远程下载NCBI
SRA的测序数据,但是不知怎么回事网速巨慢(<1kb);网上查了下用Aspear下载貌似还挺快,速度可达10M/S。

措施1 NCBI告知的不二法门(中断不能够三番五次下载)

下载后直接解压到有个别指定地方

  • 搜索SRA并获取accesion list
    在NCBI
    sra页面(https://www.ncbi.nlm.nih.gov/sra)输入登陆号%E8%BE%93%E5%85%A5%E7%99%BB%E9%99%86%E5%8F%B7)(
    accession number )进行查找;彰显搜索结果如下
    图片 2
    此地显得的是该project下的所有数据,点击一个,进入sra数据界面
    图片 3
    那边点击1GB(数据大小)的链接,进入下载界面
    图片 4
    再点击Accesion List 下载 Accesio List

  • 采用SRA Tookit 的prefetch举行下载
    prefetch 放在sratoolkit文件夹下的bin

     ~/utilities/sratoolkit.2.8.2-1-centos_linux64/bin/prefetch --option-file SRR_Acc_List.txt
    

      sra数据会下载到家目录下的ncbi/public/sra中,perfetch
    默许aspera下载(若是存在于环境变量,否则使用https下载),也可安装aspera,Ex:prefetch
    -t ascp -a
    “/opt/aspera/bin/ascp|/opt/aspera/bin/asperaweb_id_dsa.openssh”
    –option-file file.txt; file.txt
    格式为每一行三个S昂科雷奥迪Q5#,可以使用下载界面的RunInfo table下载的文书
    图片 5
    更详情的请查看prefetch
    帮忙:https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc&f=prefetch

linux版下载地址:百度网盘https://pan.baidu.com/s/1jH9Kd1O

方法2使用wget 下载

以下是NCBI 存放SRR5483089的路径
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/SRR/SRR548/SRR5483090/
可见ftp构成:
ftp://ftp.ncbi.nlm.nih.gov/sra/sra-instant/reads/ByRun/sra/S安德拉大切诺基/+SCR-V奥迪Q5+登陆号前几人数字(548)+/S宝马X3奥迪Q7+完整登陆号(5483089)
进去即可看出FTP文件,可以直接下载恐怕通过复制链接用wget 下载

安装步骤:

  1. 解压之后  sh aspera-connect-3.6.1.110647-linux-64.sh

  2. 上述命令之后,home目录下会出现.aspera/ 的公文夹,执行文书就在里边

下载命令:

ascp -T -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh -l 200m
anonftp@ftp.ncbi.nlm.nih.gov:/sra/sra-instant/reads/ByStudy/sra/SRP/SRP***/SRP******/SRR*******/SRR*****.sra
./

-T 表示不加密下载;

-i   下载密钥,软件自带;

-l 设置最大传输速度;

–user=string   用户名,NCBI的为anonftp,EBI的为era-fasp;

–host=string  
ftp的host名,NCBI的为ftp-private.ncbi.nlm.nih.gov;EBI的为fasp.sra.ebi.ac.uk;

–mode=string 选拔情势,上传为 send,下载为 recv。

其它测序数据上传至NCBI也可用Aspera,见小编以前的博客NCBI-SRA数据上传流程

相关文章