linux下下载基因组程序,从 NCBI 批量下载基因组的方法
时间: 2023-12-31 08:07:04 浏览: 320
批量下载程序和表结构(转)
在 Linux 下下载基因组程序,可以使用常见的命令行下载工具如 wget 或 curl 等,也可以使用专业的基因组下载工具如 NCBI 的 Entrez Direct 工具。
针对批量下载基因组,可以使用 NCBI 的 E-utilities 工具。以下是使用 E-utilities 批量下载基因组的步骤:
1. 打开 NCBI 的网站,搜索需要下载的基因组。
2. 选择需要下载的基因组,记录下该基因组的 Accession 号。
3. 安装 Entrez Direct 工具,可在 NCBI 的 Entrez Direct 页面下载安装包。
4. 打开终端,进入工作目录,执行以下命令:
```
esearch -db assembly -query "accession1 OR accession2 OR accession3..." | efetch -format docsum | xtract -pattern DocumentSummary -element FtpPath_GenBank > ftp_links.txt
```
其中,accession1, accession2, accession3... 是需要下载的基因组的 Accession 号,多个 Accession 号用 OR 连接。
5. 上述命令将查询 NCBI 的 assembly 数据库,获取指定 Accession 号的基因组信息,提取出 GenBank FTP 链接,并保存到 ftp_links.txt 文件中。
6. 执行以下命令下载基因组:
```
wget -i ftp_links.txt
```
该命令将读取 ftp_links.txt 文件中的链接,使用 wget 工具进行下载。
注意:使用 E-utilities 工具下载基因组需要注意 NCBI 的使用条款,不得将下载的数据用于商业用途。
阅读全文