机器学习驱动的大规模多尺度工作流框架：突破现有限制

132 浏览量更新于2024-06-16 收藏 1.06MB PDF 举报

身份认证购VIP最低享 7 折!

领优惠券(最高得80元）

大规模多尺度工作流的推广和学习：机器学习与原理的框架随着机器学习技术的快速发展和超级计算机日益复杂的异构架构，对能够处理大规模多尺度问题的需求不断攀升。这些需求促使科学家们寻求自动化和自主性，使不同规模的组件能够无缝协同工作，同时适应多尺度系统的复杂性。传统的多尺度工作流往往局限于耦合两个规模层次，但在实际应用中，如气候变化模拟、材料科学和生物系统建模等领域，需要更高级别的并行处理和协调。在这个背景下，研究人员提出了一种创新的解决方案——可扩展和可推广的大规模并行多尺度机器学习建模基础设施（MUMMI）。MUMMI通过结合机器学习算法和原位反馈耦合模型，实现了对多种尺度的高效处理和集成。这一突破性框架允许工作流跨越更大的尺度范围，例如在首次展示了使用三种不同分辨率的案例中，显著提升了模拟的复杂性和准确性。这项研究是在多个知名科研机构，如美国劳伦斯利弗莫尔国家实验室（LLNL）和橡树岭国家实验室（ORNL）进行的，这些机构在计算科学、物理、生命科学和全球安全计算领域有着深厚的专业背景。团队成员包括哈什·巴蒂亚、张晓华、克里斯·斯坦利等，他们在各自的领域内对机器学习、工作流优化和高性能计算有着丰富的经验和贡献。通过MUMMI，科学家们能够处理前所未有的数据量，解决以往受限于资源分配和模型协调的问题。这种方法不仅提升了模拟效率，还为未来在解决诸如气候模型中的地球系统动力学、药物设计中的分子结构模拟等多尺度问题提供了强有力的技术支持。随着这一框架的进一步发展和推广，我们有理由期待在众多科学领域看到更大规模、更精细的多尺度模拟，从而推动科学技术的进步。

资源详情

资源推荐

关闭

，

USA

H. Bhatia

等

人

限制导致需要显式地限制某些

I/O

操作的速率此外，

在作业调度

的缩放获得捆绑类似的作业，以减轻调度器上的负载。然而，

这种方法是不可取的，因为它阻止了对单个作业的显式控制

总体而言，MU MMI的所有组件，包括作业

和数据管理、数据

和控制通信以及公开的

API

，都与特定问题紧密集成

阻止了将

MMI

用于我们的新应用程序。

在

这项工作中，我们提出了一种新的设计，扩展了M u

MMI

的通用性和可扩展性，并通过扩展

M u MMI

的工作流程，以

支持第三规模的分辨率演示这些创新。此后，除非明确指出，

MMI

是指

我们的新的，改进的，可推广的框架。

广义上，多尺度模型可以通过

尺度的成对耦合对于任何两个

尺度，需要一些基本的构建块：（

）在两个（粗

细或

宏观

微观）尺度

上的模拟和分析

（

）一种自动化的方法来决定哪些粗略的表示要提升到精细尺

度，以及（

）一种执行反馈的方法

在这种情况下，我们将

MMI

设计为包括两个部分

应用程序

和

协调

（参见图

）。前者

定义了应用范围（根据上面列出的构建块），

例如，

什么尺度是

相关的，使用什么代码和

或模拟

工具，什么ML技术是合适的，

以及如何进行反馈？这些组件通常由

计算科学家设计，他们是

相应领域的专家

;实际细节可能会因应用程序甚至模拟而异广义

MU MMI工作流（协调部分）的作用是将不同的应用程序联系

在一起

组件，以促进多尺度模拟。

我们首先讨论我们的三个规模的应用程序的具体细节

其次是

通用和定制的协调策略

图2：我们提出了一个可推广和可扩展的框架，以不同的分辨

率尺度耦合不同的模型。“应用程序”组件（顶部）定义了三

个尺度，并且可以交换以支持其他应用程序，而“协调”组件

（底部）提供了一个接口来耦合相关的工具，软件组件和技

术，以促进可扩展的

4.1

三刻度

MMI

这项工作使用三种分辨率尺度：

连续体

，

粗粒度

（CG）和

所有

原子

（AA），以及两种类型的ML为基础的选择和两种类型的

原位

反馈。虽然在这项工作中使用的每一个应用程序组件本

身都有显着的创新，无论是建模，开发，或性能，我们只简

要地描述这些组件，主要集中在其相当大的计算的多功能

性，挑战工作流程。

(1)

连续体模拟三个尺度的粗尺度是一个

宏模型

，它以牺牲精

度为代价提供了速度。我们的宏观模型是脂质的

连续

描述，

使用DDFT [50]来表示密度场方面的脂质动力学。蛋白质（位

置和构型状态）被

表示为彼此相互作用并与脂质相互作用的粒

子

。

双层离散化

以2400 ~ 2400网格划分，内层有8种脂类，

外叶[34]。我们使用一个自定义的模拟包，GridSim 2D-一个

并行CPU代码用C++编写，使用MPI进行

通信。使用总共

3600

个

MPI

等级（每个等级

个

CPU

核心），

150个节点），GridSim2D可以模拟每天10.96ms的

walltime

。

在

的

I/O

速率下，每

秒发送一个新快照，当以自定义二进制

格式存储时，

374 MB

的磁盘空间。

(2)

图1：连续体到CG的映射与连续尺度相比，

和

模拟

由于计算成本高而在空间范围上受到限制。为了将连续谱与

这些尺度耦合，在CG和AA模拟可能感兴趣的区域中从连续谱快照

中切出30 nm 30 nm

“

补丁

”

。

该

模块将一个补丁从

连续表示转换

为基于粒子的。

疯狂

的工具[74]用于创建膜和蛋白质的CG表

示一旦构建，GROMACS [1]用于将

膜和蛋白质

松弛到更自然，

平衡的状态，为模拟做准备SimpleSim是一个基于

Python

的自

定义

使用

个

CPU

内核的代码，平均需要

1.5

小时才能完成

完成.

(3)

CG模拟与分析考虑到脂质和蛋白质的粒子表示，使用

ddcMD [68]的 CUDA

启用版本[78]执行具有Martini力场[51]

的基于Python的自定义分析在同一计算节点上同时执行，并

访问本地节点

RAM

磁盘，以分析相应模拟生成的

轨迹。每

个ddcMD模拟使用一个GPU和一个CPU核心;

相应的分析分配了3个CPU核心。在这种设置和平均140，000

个粒子的情况下，

ddcMD

每天在每个

GPU

上提供

1.04

的

轨迹[78]，每41.5秒产生约分析模块被调整为在该时间段内完

成检查每个快照，

每

41.5

秒生成

17 KB

的额外数据

(4)

反向映射：将CG映射到AA。为了克服CG模型[4]的局限

性，使用

反向映射

方案对其进行了进一步改进，该方案使用

CHARMM 36力场[10]将CG表示在时间上转换为AA本程序

剩余15页未读，继续阅读

cpongm

粉丝: 5
资源: 2万+

机器学习驱动的大规模多尺度工作流框架：突破现有限制

大规模多尺度工作流的可扩展协调：挑战和学习

数据挖掘 ：机器学习算法框架

机器学习框架是什么？

spark框架的机器学习和基于python语言的机器学习有什么不同

如何开始学习机器学习

机器学习和多尺度微动疲劳预测的学科交叉会有什么难度和问题

专业是计算机在学习研究过程中用到的机器学习相关理论技术

机器学习的框架去哪里寻找

我应该如何学习机器学习？

用多尺度微动疲劳寿命预测机器学习方法来培养学生的目的

人工智能导论机器学习的一般原理和方法

机器学习和深度学习入门

机器学习和多尺度建模的结合

python机器学习框架推荐

详细解释机器学习的技术原理

python机器学习学习路线

机器学习boost框架

怎么学习深度学习和机器学习

基于mindspore的自动机器学习框架

最新资源

数据挖掘：机器学习算法框架