利用概率超图文法提升分子优化效率

需积分: 0 0 下载量 93 浏览量 更新于2024-08-05 收藏 237KB PDF 举报
"2019年,概率超图文法在高效分子优化中的应用 - 强化学习 - rrr1" 本文介绍了如何利用概率超图文法提高分子优化的效率。作者Egor Kraev和Mark Harley来自Mosaic Smart Data Ltd,他们提出了一种新的方法,该方法基于ChEMBL数据库来推断超图替换文法,并统计特定规则在扩展其他规则中的使用频率,这些频率被用作策略模型的条件先验。 超图文法是一种强大的表示工具,能够处理复杂的结构,如分子结构。在分子优化问题中,它们可以用来生成和修改分子结构。通过从ChEMBL数据库中学习,作者构建了一个概率超图文法,其中每个非终结符可以按照一定的概率规则展开。与等概率规则或无条件先验相比,使用条件先验能够使生成的分子分布更接近训练集。 接着,他们将分子优化问题转化为强化学习任务,采用了一种改进的策略梯度算法——批量优势(batch-advantage)。这种方法使用单个奖励减去批次平均奖励来加权对数概率损失,从而指导代理学习更优的策略。强化学习代理的任务是利用这个文法构造分子,目标是最大化从文献中获得的基准分数。 在这个过程中,代理会根据环境的反馈不断调整其行为,选择最有可能导致高分数的规则序列。通过反复试验和学习,代理能够学习到一组有效的规则组合,用于生成具有优秀特性的新分子。实验结果表明,这种基于概率超图文法和强化学习的方法在分子优化中表现出了显著的性能提升。 此外,这种方法的潜力在于其可扩展性和通用性。由于其基于数据驱动,因此可以应用于不断更新的化学数据库,适应新的分子结构和性质。同时,强化学习框架允许适应不同的优化目标,比如提高药物活性、降低毒性或者改善合成可行性。 "2019-Probabilistic hypergraph grammars for efficient molecular optimization"展示了概率超图文法在分子设计中的强大能力,结合强化学习策略,为化学和药物研发提供了一种新颖且高效的工具,有望加速新药发现和材料创新。