Anton3：20微秒分子动力学模拟的超级计算机研究

146 浏览量更新于2024-06-19 收藏 2.56MB PDF 举报

"3：20微秒分子动力学模拟研究" 这篇资源主要关注的是一个名为"Anton3：Twenty Microseconds of Molecular Dynamics Simulation"的科研项目，由Lunch Joseph银行支持。这个项目专注于利用高性能计算进行生物相关分子的原子级别模拟。分子动力学模拟是一种计算化学方法，它允许科学家通过解决牛顿运动方程来研究分子系统的动态行为，包括它们如何随时间变化、相互作用以及形成特定结构。 Anton3是这个领域的专用超级计算机系统，其设计目标是为了在极短的时间尺度上模拟生物分子的行为。传统的计算机可能需要数年时间才能完成这样的模拟，而Anton3则显著提高了效率，能够在一个相对短的时间内（20微秒）完成这一任务。这对于理解蛋白质折叠、药物与受体的相互作用、酶催化反应等生物过程具有重大意义。参与这个项目的团队由多个领域的专家组成，包括但不限于Davide Shaw、Peter J. Adams、Ron O. Dror、Bruce Edwards、Amos Even、Anthony Fenn、Jeremy Hunt等。这些研究人员来自D. E. Shaw Research公司，这是一家位于纽约的知名科研机构，专注于计算生物物理学和药物发现的研究。分子动力学模拟的这种加速能力使得科学家能够更深入地探索生物分子的动力学特性，例如蛋白质的动力学稳定性和瞬态构象，这对于药物设计至关重要。通过模拟，可以预测分子间的相互作用，有助于发现新的药物靶点和优化现有药物的结构，从而提高药物效力和降低副作用。此外，Anton3的性能提升对于理解复杂生物系统，如细胞膜中的蛋白质网络、病毒组装过程、以及疾病相关蛋白质聚合物的形成也具有重要意义。这些研究不仅有助于基础科学的理解，还能直接推动药物开发和治疗策略的进步。总结来说，"Anton3：Twenty Microseconds of Molecular Dynamics Simulation"项目代表了分子动力学模拟技术的一个里程碑，它通过高度优化的超级计算平台，极大地扩展了我们对生命科学中微观世界动态的理解，对于未来的药物研发和生物医学研究将产生深远的影响。

MD模拟经常在普通计算机上运行，其中一个或更多的

GPU作为计算加速器提供。单节点平台由许多MD软件包

提供支持。[17]张永：18岁。 CHARMM [19]，德斯蒙

德 [20]， GROMACS” [ 21 ]

蓝色 HOOMD[ 22 ] Lammps 的” [ 23 ] namad 的” [ 24 ]而

each with different features and performance （不同的功能

和性能）characteristics 。

目前，这些代码最快的单节点兼容性平台包括NVIDIA

A100 SXM 4 GPU；该平台在STMV基准测试上的峰值性

能报告低于0.07 μ s/day [21][25]。1 . 寻求减少对其他平

台的解决时间，增加超出 8 个领域的处理单元数量

improvement on 改进 the STMV Benchmark 的 ” [ 21 ]

scaling 的IS Even Worse for小分子 Molecular Systems因为

the成本of Distribution Among 计算机the large 大Number of

GPU Core 的而 integration 综合 the 结果 of Those

Computations on EACH Time step Overshadows 的any gains

from parallelization across the core （通过线支付）” [ 27 ]

Several MD 软件包（ GENESIS [ 28 ] ，

GROMACS ， HOOMD-blue [ 29 ] ， LAMMPS ，和

NAMD ）CAN

生物分子系统的十亿分之十到几个十亿个原子，穿过机器

处理通用目的节点的大尺寸数字，但这些机器的缩放并没

有产生超出0.2 μ s/天的性能。结果模拟开放的短期

（分 - Microsecond ）观点极端大生物分子系统，但

他们没有实现长期的必要性能（多 Microsecond 至

Millisecond ）具有一百万科学原子或辐射的系统的

模拟，一个规模的范围包括微生物组对基本药物

和研究的兴趣Discover .

Aside from the Anton Machines ， other supercomputers

specialized for MD Simulation 已经有报道。MDGRAPE—

4A是一个512—node特殊用途的机器，每个node带有一个

定制芯片。MDGRAPE - 4A 的容量尚未报告，但其在

STMV （从模拟中推断出的性能）of

～ 100 ， 000 atoms ） [32] would be ～ 0.1 μ s/day 。基于

FPGA的专业硬件[33][34]已被设计用于MD，且报告了与

单个GPU的性能竞争。

安东 2 是全原子 MD 模拟的艺术现状 of

Biochemical 生物化学Systems of up两个三个百万原子 .

它典型地被用于对 100 个 Microseconds each 进行模拟

（虽然有些人达到了几个千禧年），并且是我们

药物发现和生物化学的基础研究 | OUR第 512 章安东

Anton 2 Machines 的（ With 每个 node 单点定制芯片

（ Single Custom-Designed Chip Per Node ） Achieve 。

周围 10μ s/day of Simulation on the 百万原子 STMV

Benchmark 在 2013 年的一份报告中表示，一项超过

两个订单规模的速度超过了当时最快的通用超级

计算机可用的速度，并超过了今天的顶级超级计算

机。安东 3 超级计算机 described in this paperredefines 的

the State of the ART for解决时间 Time to Solution AS well

作为 per-node throughput on MD simulation ，感谢新的

重要创新design .

I novations 的r危险

本节第一次介绍了安东 3 号芯片架构的概况，

而Then Details selected Innovations在subsections A-D 。

安东 Anton3 何为 designed from the Ground up 两个

Reduce通过最大化并行化并利用不断演变的硬件技

术来解决问题的时间。 Though it carries over a few

general design （很少有普通设计）主题 from 安东

Anton 1而安东 Anton 2 . 包括the use或特悬CHIPS 芯片

with AN综合性3D torus Network（ Fig. ） Anton 3 的共同

设计算法，硬件和软件 - 实际设计由 Anton 3 提供，

其适配器的细节很少。The Novel Design of the Anton 3

Chip supports many （安东 3 号芯片的创新设计）

NEW Molecular 分子Simulation能力而IS乐观化解决半导

体技术中的两个关键扩展趋势：增加高性能芯片

和减少通信带宽相对于计算阈值的功率需求，以及

增加 MD 的有效并行化Application 。

As在Prior世代，the MD Application partitions the 3D 空

间of the chemical系统Into竞争性BOXES而Assigns 他们两

个 Nodes So that Neighboring 邻居 chemical 系统 BOXES

reside on neighboring nodes in the torus 附近的节点。2013

年04月21日@下午12时40分i + n =（Home Box因此，将这

些原子子集的位置发送到其他节点，以允许在不同盒子中

计算原子之间的力量。 the 结果 resulting 部队 are Then

returned 相关两个 Their 2.2.1 . subsequently integrates the

forces to update atom positions for the next time 下一次更

新原子位置的力。step .

有效地平行化 MD 的发展，以维持通信和写作

之间的平衡，communication Bandwidth 的IS Scaling 的

more慢于当前半导体技术中的计算阈值。 to Address

this挑战，the安东 Anton 3 CHIP adopts a highly regular ，

tiled layout （ Fig. 3b ） that optimizes both communication .

采纳了一个非常常规的， tiled 布局而Computation 。

the CHIP consists 意见 primarily 初 of repeated 相关 Core

Tiles

的评论

而Edge Tiles

系列

。核心 Tiles Are Arranged In

Anarray of 12 ROWS By 24 columns 在 the Center of the 芯

片，并包括两个专门的管道和执行 MD 计算的通用

目的处理器。Edge Tiles Flank the Core Tile array on the

left and right ， managing communication between Core Tiles

and the inter-chip 3D （ 3D ）（边缘 Tiles Flank the Core

Tile 数组在左和右，管理核心票据与 Inter-chip 3D 之

间的通信） Torus Network （英语： Using Off-chip

High-Speed Serial Network Outboard ） of the Edge Tiles在

Fig. 3B ）。 the CHIP contains 96 关闭芯片串行通道

（英语： Off chip serial lanes ）（ SERDES

transmit/receive pairs ）at

29 Gbps in each direction ， providing 5.6 Tbps of total

bandwidth （ each direction 中为 29 Gbps ，提供总带宽 5.6

Tbps）

Fig. 3c shows the components of the core tile in more

detail.图3c显示核心区的组件在更详细的地方.网络安全公

司（Core Router

系统

（1）将计算机块连接到2D通用网络

中的芯片。专用

公交车位置

而Force

客车

例如，原子位

置和力的移动，并从Pairwise Point Interaction Modules

（双点交互模块）

PPIM ：包括用于计算非绑定交

互的专用管道（ Subsection ）b ） . NEW在安东 Anton

3, A A特悬Bond

计算器

（ BC ） handle computation of

剩余20页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

Anton3：20微秒分子动力学模拟的超级计算机研究

mr:分子动力学模拟

分子动力学模拟方法概述

lammps分子动力学模拟

Anton 3：20微秒分子动力学模拟的突破

KcsA钾通道的多级开放过程:靶向分子动力学模拟 (2009年)

分子模拟实战：Amber分子动力学计算入门与应用

GPU加速的CHARMM分子动力学模拟在WCCS中的性能提升

准分子激光器的进展

植物体系中的微/纳米尺度传热研究进展

Principal Components Analysis:

最新资源