#rnaseq #linux
下载原始数据#
sra-tools#
sra-tools 包含了 fastq-dump 工具,可以用来从 SRA(Sequence Read Archive)数据库中下载测序数据并将其转换为 FASTQ 格式。使用 fastq-dump 工具,并指定以下参数:
fastq -dump --split 3 SRA2176358-dump: 表示执行下载和转换操作。--split 3: 表示将双端测序数据分割成两个文件,每个文件包含原始测序数据的一半。这个参数的值为3,表示每个原始测序数据的一半被分割成一个独立的文件。SRA2176358: 是你要下载和转换的 SRA 数据库中的样本标识号。
因此,这个命令的作用是下载 SRA 数据库中的样本 SRA2176358 的测序数据,并将其转换为两个 FASTQ 文件,每个文件包含一半的原始测序数据。
ascp#
下载aspera软件 conda可以下载 也可以去官网下载压缩包手动安装
然后找SRA号去这个网站生成下载脚本(https://sra-explorer.info/) 生成的脚本长这样
ascp -vQT -l 500m -P33001 -k 1 -i \
~/.aspera/connect/etc/asperaweb_id_dsa.openssh \
era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR122/079/SRR12207279/SRR12207279_1.fastq.gz ./######### 主要使用参数
-v 详细模式
-Q 用于自适应流量控制,磁盘限制所需
-T 设置为无需加密传输
-l 最大下载速度,一般设为500m
-P TCP 端口,一般为33001
-k 断点续传,通常设为 1
-i 免密下载的密钥文件

