screen3d_distributed:利用 Hadoop 实现分布式分子对齐计算
需积分: 5 59 浏览量
更新于2024-11-04
收藏 38KB ZIP 举报
资源摘要信息:"screen3d_distributed 是 ChemAxon 开发的一款命令行工具,专注于通过 Screen3D Java API 以及 Hadoop mapreduce 技术实现大规模分子对齐计算。该工具特别设计用于在分布式计算环境中快速处理成千上万的计算节点。具体到本文档,我们进一步了解了 screen3d_distributed 的内部运作原理、所需技术栈、以及在 Google 计算引擎上的运行性能。
在技术实现层面,screen3d_distributed 通过构建在 Screen3D Java API 之上,并利用 Hadoop 的 mapreduce 框架进行大规模并行计算。其核心功能是对输入的分子文件进行处理,输出为包含所有可能的分子对及它们对齐后的相似性 3D Tanimoto 分数的 sdf 文件格式。3D Tanimoto 分数是评估分子结构相似性的一种度量方式,广泛应用于药物设计等领域。
在运行环境方面,screen3d_distributed 对操作系统的要求是 Linux 系统,具体使用了 Ubuntu 14.04 的虚拟机镜像进行测试。同时,用户需要具备 Java 编程语言以及 Maven 构建工具的知识,以便正确安装和配置该工具。
从性能角度考量,screen3d_distributed 在 Google 计算引擎上表现出的计算能力非常强大。通过测试,4000 个节点在一小时之内能够完成约 2500 万次分子对比较任务,而成本仅需大约 500 美元。如此高的计算效率和经济效益,使其在需要处理大量分子数据的生物信息学、化学信息学以及药物研发领域具有极大的应用价值。
除了技术实现和性能特点,screen3d_distributed 也对输入格式进行了规定,即只支持标准的分子文件格式。因此,用户在使用该工具前,需要准备符合输入要求的分子数据文件,以确保可以顺利地进行计算任务。
此外,文档还提到在使用 screen3d_distributed 时,mapreduce 作业需要通过命令行来运行。这表明用户可能需要具备一定的命令行操作经验,以便能够正确地在分布式环境中部署和执行计算任务。
最后,文档中提及的 '压缩包子文件的文件名称列表' 中的 'screen3d_distributed-master' 可能是指该工具的源代码仓库或项目文件夹名称。这说明了用户在安装和使用 screen3d_distributed 前,可能需要从相应的代码托管平台(如 Git)上克隆或下载该项目的源代码,以便进一步编译、构建和部署。
总结以上内容,screen3d_distributed 是一款基于 Hadoop 技术,专注于分子对齐计算的命令行工具。其通过高效利用分布式计算资源,在化学信息学领域提供了强大的计算支持,尤其适合在需要进行大规模分子数据处理的场合使用。同时,该工具也对用户的操作环境、技术栈以及命令行操作能力提出了相应的要求。"
点击了解资源详情
点击了解资源详情
点击了解资源详情
2021-07-07 上传
2021-07-05 上传
2021-07-05 上传
2022-09-20 上传
2024-03-15 上传
2021-07-10 上传
普通网友
- 粉丝: 30
- 资源: 4570
最新资源
- C语言数组操作:高度检查器编程实践
- 基于Swift开发的嘉定单车LBS iOS应用项目解析
- 钗头凤声乐表演的二度创作分析报告
- 分布式数据库特训营全套教程资料
- JavaScript开发者Robert Bindar的博客平台
- MATLAB投影寻踪代码教程及文件解压缩指南
- HTML5拖放实现的RPSLS游戏教程
- HT://Dig引擎接口,Ampoliros开源模块应用
- 全面探测服务器性能与PHP环境的iprober PHP探针v0.024
- 新版提醒应用v2:基于MongoDB的数据存储
- 《我的世界》东方大陆1.12.2材质包深度体验
- Hypercore Promisifier: JavaScript中的回调转换为Promise包装器
- 探索开源项目Artifice:Slyme脚本与技巧游戏
- Matlab机器人学习代码解析与笔记分享
- 查尔默斯大学计算物理作业HP2解析
- GitHub问题管理新工具:GIRA-crx插件介绍