下载原始数据

#rnaseq #linux

下载原始数据#

sra-tools#

sra-tools 包含了 fastq-dump 工具,可以用来从 SRA(Sequence Read Archive)数据库中下载测序数据并将其转换为 FASTQ 格式。使用 fastq-dump 工具,并指定以下参数:

fastq -dump --split 3 SRA2176358
  • -dump: 表示执行下载和转换操作。
  • --split 3: 表示将双端测序数据分割成两个文件,每个文件包含原始测序数据的一半。这个参数的值为 3,表示每个原始测序数据的一半被分割成一个独立的文件。
  • SRA2176358: 是你要下载和转换的 SRA 数据库中的样本标识号。

因此,这个命令的作用是下载 SRA 数据库中的样本 SRA2176358 的测序数据,并将其转换为两个 FASTQ 文件,每个文件包含一半的原始测序数据。

ascp#

下载aspera软件 conda可以下载 也可以去官网下载压缩包手动安装

然后找SRA号去这个网站生成下载脚本(https://sra-explorer.info/) 生成的脚本长这样

ascp  -vQT -l 500m -P33001 -k 1 -i \
~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR122/079/SRR12207279/SRR12207279_1.fastq.gz  ./

######### 主要使用参数
-v 详细模式
-Q 用于自适应流量控制,磁盘限制所需
-T 设置为无需加密传输
-l 最大下载速度,一般设为500m
-P TCP 端口,一般为33001
-k 断点续传,通常设为 1
-i 免密下载的密钥文件