限制导致需要显式地限制某些
I/O
操作的速率此外,
在作业调度
的缩放获得捆绑类似的作业,以减轻调度器上的负载。然而,
这种方法是不可取的,因为它阻止了对单个作业的显式控制
总体而言,MU MMI的所有组件,包括作业
和数据管理、数据
和控制通信以及公开的
API
,都与特定问题紧密集成
阻止了将
MU
MMI
用于我们的新应用程序。
4
在
这项工作中,我们提出了一种新的设计,扩展了M u
MMI
的通用性和可扩展性,并通过扩展
M u MMI
的工作流程,以
支持第三规模的分辨率演示这些创新。此后,除非明确指出,
M
U
MMI
是指
我们的新的,改进的,可推广的框架。
广义上,多尺度模型可以通过
尺度的成对耦合对于任何两个
尺度,需要一些基本的构建块:(
1
)在两个(粗
/
细或
宏观
/
微观)尺度
上的模拟和分析
(
3
)一种自动化的方法来决定哪些粗略的表示要提升到精细尺
度,以及(
4
)一种执行反馈的方法
在这种情况下,我们将
MU
MMI
设计为包括两个部分
-
应用程序
和
协调
(参见图
2
)。前者
定义了应用范围(根据上面列出的构建块),
例如,
什么尺度是
相关的,使用什么代码和
/
或模拟
工具,什么ML技术是合适的,
以及如何进行反馈?这些组件通常由
计算科学家设计,他们是
相应领域的专家
;实际细节可能会因应用程序甚至模拟而异广义
MU MMI工作流(协调部分)的作用是将不同的应用程序联系
在一起
组件,以促进多尺度模拟。
我们首先讨论我们的三个规模的应用程序的具体细节
其次是
通用和定制的协调策略
图2:我们提出了一个可推广和可扩展的框架,以不同的分辨
率尺度耦合不同的模型。“应用程序”组件(顶部)定义了三
个尺度,并且可以交换以支持其他应用程序,而“协调”组件
(底部)提供了一个接口来耦合相关的工具,软件组件和技
术,以促进可扩展的
4.1
三刻度
M
U
MMI
这项工作使用三种分辨率尺度:
连续体
,
粗粒度
(CG)和
所有
原子
(AA),以及两种类型的ML为基础的选择和两种类型的
原位
反馈。虽然在这项工作中使用的每一个应用程序组件本
身都有显着的创新,无论是建模,开发,或性能,我们只简
要地描述这些组件,主要集中在其相当大的计算的多功能
性,挑战工作流程。
(1)
连续体模拟三个尺度的粗尺度是一个
宏模型
,它以牺牲精
度为代价提供了速度。我们的宏观模型是脂质的
连续
描述,
使用DDFT [50]来表示密度场方面的脂质动力学。蛋白质(位
置和构型状态)被
表示为彼此相互作用并与脂质相互作用的粒
子
。
1
µ
m
双层离散化
以2400 ~ 2400网格划分,内层有8种脂类,
外叶[34]。我们使用一个自定义的模拟包,GridSim 2D-一个
并行CPU代码用C++编写,使用MPI进行
通信。使用总共
3600
个
MPI
等级(每个等级
24
个
CPU
核心),
150个节点),GridSim2D可以模拟每天10.96ms的
walltime
。
在
1
µ
s
的
I/O
速率下,每
90
秒发送一个新快照,当以自定义二进制
格式存储时,
374 MB
的磁盘空间。
(2)
图1:连续体到CG的映射 与连续尺度相比,
CG
和
AA
模拟
由于计算成本高而在空间范围上受到限制。为了将连续谱与
这些尺度耦合,在CG和AA模拟可能感兴趣的区域中从连续谱快照
中切出30 nm 30 nm
“
补丁
”
。
该
模块将一个补丁从
连续表示转换
为基于粒子的。
疯狂
的工具[74]用于创建膜和蛋白质的CG表
示一旦构建,GROMACS [1]用于将
膜和蛋白质
松弛到更自然,
平衡的状态,为模拟做准备SimpleSim是一个基于
Python
的自
定义
使用
24
个
CPU
内核的代码,平均需要
1.5
小时才能完成
完成.
(3)
CG模拟与分析考虑到脂质和蛋白质的粒子表示,使用
ddcMD [68]的 CUDA
®
启用版本[78]执行具有Martini力场[51]
的 基于Python的自定义分析在同一计算节点上同时执行,并
访问本地节点
RAM
磁盘,以分析相应模拟生成的
MD
轨迹。每
个ddcMD模拟使用一个GPU和一个CPU核心;
相应的分析分配了3个CPU核心。在这种设置和平均140,000
个粒子的情况下,
ddcMD
每天在每个
GPU
上提供
1.04
µ
s
的
MD
轨迹[78],每41.5秒产生约分析模块被调整为在该时间段内完
成检查每个快照,
每
41.5
秒生成
17 KB
的额外数据
(4)
反向映射:将CG映射到AA。为了克服CG模型[4]的局限
性,使用
反向映射
方案对其进行了进一步改进,该方案使用
CHARMM 36力场[10]将CG表示在时间上转换为AA本程序