没有合适的资源?快使用搜索试试~ 我知道了~
首页机器学习优化RNA分子静电能预测:全连接神经网络与H原子剔除研究
机器学习优化RNA分子静电能预测:全连接神经网络与H原子剔除研究
1.该资源内容由用户上传,如若侵权请联系客服进行举报
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
2.虚拟产品一经售出概不退款(资源遇到问题,请及时私信上传者)
版权申诉
0 下载量 47 浏览量
更新于2024-07-02
收藏 3.23MB PDF 举报
云计算在科学研究中的应用日益广泛,特别是在RNA分子力场计算领域。传统的实验方法成本高且难以实时获取详细信息,而分子力场模拟作为一种计算密集型技术,通过云计算的优势得以大幅降低成本,提供精确的化学反应过程观察。本文聚焦于改进RNA分子力场中的静电能项计算,特别是针对原子多级距的预测。 传统RNA分子力场模型通常采用点电荷模型来处理静电相互作用,但这未能真实反映量子力学中的电子分布,导致预测精度不高。作者提出利用全连接神经网络(FCN)这一机器学习方法,通过对原子间距离的多级距进行预测,显著提高了计算效率和结果的准确性。通过剔除氢原子(H)的结构进行预测,实验结果显示,去除H原子后预测性能有所提升,证明了H原子在RNA电子云分布中的位置信息存在冗余,其对整体静电影响较小,可以忽略。这不仅支持了在研究过程中使用饱和H原子结构的合理性,还揭示了在构建RNA分子力场时可以简化处理的策略。 量子化学拓扑理论是这项工作的理论基础,它结合了分子结构和量子力学,帮助理解电子云的复杂行为。通过对H原子的简化处理,研究者们能够更专注于其他关键因素,如非对称的电子分布和几何结构对静电势的影响。这种方法的改进不仅提升了计算效率,也为深入研究RNA的生物功能和生理作用提供了更为精确的工具。 总结来说,本文主要贡献在于开发了一种基于全连接神经网络的云计算策略,用于改进RNA分子力场中的静电能项计算,通过简化模型减少计算负担,同时提高预测精度。这对于理解RNA在生物学和医学领域的多种功能以及优化药物设计等具有重要意义。
资源详情
资源推荐
兰州大学硕士学位论文 RNA 分子力场中静电能项的改进计算
7
第二章 相关理论介绍
薛定谔方程
[109]
(Schrödinger Equation)是量子化学的基础。通过使用该方程,
采用从头算的方法就可以预测我们想要的化学信息,而不需要任何相关的化学知
识(例如化学性质)。但是这种方法计算代价较高,因此人们目前使用的都是半经
验的方法构建模型。以下是本文研究工作中涉及到的相关概念。
2.1 分子力场
由 Bixon 和 Lifson
[110, 111]
提出的流行方程通常用于表达生物系统的潜在能量
函数,分子力场能包括成键能和非成键能,用公式可以表示为:
其中前三项是成键能,分别为:键的伸缩能、键角的弯曲能、扭转角的扭转
能:
非键相互作用能包括范德华力和静电相互作用势能:
本文研究的重点是非成键能
中的静电相互作用能
。
2.1.1 原子-原子相互作用静电能
静电势能由分子间的库仑力产生(或在同一分子的不同部分之间)。电场对静
止电荷有力的作用,电荷在电场中运动则会做功,可见静电场中储存着能量,物
理学中把静电场中的储能称之为静电能量。静电能量的大小是与两个粒子 A 和 B
的电荷成正比,与它们的核间距离 r
AB
成反比。两个原子之间的静电相互作用能
是根据他们的点电荷 q
A
和 q
B
计算:
其中 ε
0
是真空介电常数。使用此公式计算静电能较为常见,因为计算成本不
是很高。然而,这种此公式只能给出长距离相互作用的准确预测,在中短距离范
围内,此公式不能提供可靠的结果。为了精确计算静电能量,需要使用原子多级
距。
2.1.2 原子性质的可转移性
开发分子力场的假设之一是从小系统产生的参数可以转移到大分子系统而
万方数据
兰州大学硕士学位论文 RNA 分子力场中静电能项的改进计算
8
转移时产生的误差极小。然而,事实上原子在不同的分子中所处环境不同,原子
的性质不会一成不变。因此,为了获得准确的结果,我们应该考虑给定对象原子
所处的具体环境。但是计算环境中所有原子的成本太高,因为有时环境中会有数
百种分子结构和成千上万的原子。幸运的是,原子(或含有几个原子的官能团,如
-CH
3
、-OH)从一个分子环境到另一个分子环境有非常相似的物理化学性质。例如
C-H 键长在不同分子之间仅仅略有不同甚至几乎不变,其键长保持在 1.06 Å 和
1.10 Å 之间。不仅是键长,还有 C-H 在不同分子间的振动规律也相似规律,通常
在 2900 cm
-1
到 3300 cm
-1
之间。这表明不同环境中 C-H 的物理化学性质变化非
常小
[23]
。类似地,其他键如 C-C 键的物理化学性质在类似环境之间也变化很小。
如果将 C-C 键进一步分为单键、双键或三键,则这种变化更小。此外,官能团在
不同的分子几何形状中表现出大致相同的能量。Benzon 的论文
[112]
表明,直链烷
烃即 CH
3
(CH
2
)
n
CH
3
的总能量与分子中亚甲基(CH
2
)的数量成比例。而且,将总能
量与 n 的函数曲线近似为直线。
可转移性,即原子或官能团的性质从一个分子环境到另一个分子环境(或从
小分子到大系统)发生变化的程度,是分子力场具有良好模拟效果的基础,分子
力场的模拟效果的准确程度取决于可转移性的良好程度。分子力场中构建的模型,
应当具有良好的可转移性,此时使用相似的分子产生的参数预测几何形状将产生
令人满意的效果。例如,使用核苷酸研究产生的参数构建的模型可以用于预测任
何 RNA 中核苷酸的性质。
2.2 量子化学拓扑(QCT)理论
本文中研究的原子是量子化学拓扑
[113, 114]
的理论定义的。我们描述了基于量
子化学拓扑的原子,这是分子中原子量子理论的推广
[25, 115]
。QCT 理论使用原子
多级距计算静电能量而不是原子点电荷,因为使用前者比使用后者可以获得更准
确的结果
[116-120]
。该理论通过分子的电子云密度的梯度场将分子的电子云密度 ρ(r)
划分为不同的原子区域,从而产生严格的非重叠原子空间
[121]
。梯度场由无数路
径组成,其中大部分起源于 r = ∞(在 r = ∞处,ρ(r) = 0)并终止于原子核(即 r = 0)(在
r = 0 处,ρ(r) = 0)。原子区域(称为“盆”并标记为)由电子云密度中的零通量表
面隔开。这种最小划分方式创造了大量原子空间形状,并且每个空间形状都被其
所在位置的原子核标记。拓扑原子的一个重要特征是它们彼此不重叠,并且它们
之间不会留下间隙。换句话说,他们耗尽了真实的空间。因此,分子在真实三维
空间(Three-Dimensional:3D)中划分成相互不重叠的区域,由原子间分界面分开,
通常由 ρ(r) = 1×10
-6
au 的等密度表面构成分界面;该值经过了长时间的使用已
万方数据
兰州大学硕士学位论文 RNA 分子力场中静电能项的改进计算
9
被验证,可以捕获大于 98%的原子的总电子云密度。原子性质可以通过对原子区
域的 3D 空间上的电子云密度函数积分得到。例如,通过在拓扑原子的空间上对
电子云密度积分来获得原子多级距。可以使用 AIMAll
[122]
程序来获取相应的原
子性质。QCT 的更多细节可以在 Bader 的著作
[123]
里查看。
2.2.1 原子多级距
通过增加被描述原子的静电特性的细节,可以使化学系统中的静电相互作用
的描述更加接近物理事实。这些静电特性使得原子之间的静电相互作用的计算更
加精确。如上所述,QCT 将电子云划分为可以用各个原子标示的离散区域。然
后通过 6 维积分给出两个原子 A 和 B 之间的精确静电相互作用能:
在公式 2-5 中,r
AB
表示原子 A 和 B 的原子核之间的距离,
代表分子总基
态的电子云密度,由所有电子云和原子核组成。在高等数学中,任何函数都可以
泰勒公式展开,从而在某一点得到相近的函数值。展开式中计算的项数越多,计
算结果越接近真实值。相应的展开项的阶数越高,该项对整体的修正效果越小。
因此实际计算中不需要太高的阶数就可以得到非常接近函数真实值的结果。为了
减少计算量,公式 2-5 可以展开为以下公式 2-6 的形式,其库仑相互作用能量
[124]
根据原子核距离的增加,可以收敛到精确的相互作用能:
公式 2-6 中
和
分别代表原子 A 和原子 B 的拓扑空间
和
的原子多级距。T 是一对原子多级距之间的相互作用张量。字母和 m 分
别表示原子多级距的等级和分量。原子多级距的等级确定了积分中使用的球谐波
函数。每个原子距有 2 + 1 个独立分量 m,其中是高级原子多级距的等级。例
如,偶极距的等级为 1 并且具有 2 + 1 = 3 个分量,通常由 x,y 和 z 表示。通
过前面描述的方式将电子云密度乘以原子的 3D 体积空间内的球谐波函数来获得
原子多级距,从而避免了 6 维积分过程,然而这样做的代价是可能引入收敛问题。
由 L 表示的(原子-原子)相互作用等级测量用于计算两个相互作用原子之间的静
电能的原子多级距的数量(等级)。这个数量关系可以用公式 2-7 表示:
其中
和
分别是原子 A 和 B 的原子多级距的等级。例如,计算相互作用
等级 L = 3 的能量需要计算单极距、偶极距和四极距,因此每个原子包括 9 个(=
万方数据
剩余73页未读,继续阅读
programxh
- 粉丝: 17
- 资源: 1万+
上传资源 快速赚钱
- 我的内容管理 展开
- 我的资源 快来上传第一个资源
- 我的收益 登录查看自己的收益
- 我的积分 登录查看自己的积分
- 我的C币 登录后查看C币余额
- 我的收藏
- 我的下载
- 下载帮助
最新资源
- JDK 17 Linux版本压缩包解压与安装指南
- C++/Qt飞行模拟器教员控制台系统源码发布
- TensorFlow深度学习实践:CNN在MNIST数据集上的应用
- 鸿蒙驱动HCIA资料整理-培训教材与开发者指南
- 凯撒Java版SaaS OA协同办公软件v2.0特性解析
- AutoCAD二次开发中文指南下载 - C#编程深入解析
- C语言冒泡排序算法实现详解
- Pointofix截屏:轻松实现高效截图体验
- Matlab实现SVM数据分类与预测教程
- 基于JSP+SQL的网站流量统计管理系统设计与实现
- C语言实现删除字符中重复项的方法与技巧
- e-sqlcipher.dll动态链接库的作用与应用
- 浙江工业大学自考网站开发与继续教育官网模板设计
- STM32 103C8T6 OLED 显示程序实现指南
- 高效压缩技术:删除重复字符压缩包
- JSP+SQL智能交通管理系统:违章处理与交通效率提升
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
安全验证
文档复制为VIP权益,开通VIP直接复制
信息提交成功