"大型语言模型的自主科研能力及应用范围"

需积分: 2 198 浏览量更新于2024-01-09 收藏 2.9MB PDF 举报

本文讨论了大型语言模型在科学研究领域新兴的自主能力。基于Transformer的大型语言模型在机器学习研究领域迅速发展，应用范围涵盖自然语言、生物学、化学和计算机编程。这些模型利用极端缩放和强化学习，显著提高了生成文本的质量，使其能够执行各种任务并推理出最佳选择。本文提出了一个智能代理系统，结合多个大型语言模型，用于自主设计、规划和执行科学实验。通过三个不同的例子展示了该代理系统的科学研究能力，其中最复杂的是成功执行催化交叉偶联反应的实验。最后，文中讨论了此类系统的安全隐患，并提出了防止误用的措施。关键词：大型语言模型、智能代理、生成式人工智能、自主实验、自动化、物理科学、催化。此研究旨在探讨大型语言模型在科学研究中的新兴自主能力。通过采用Transformer的大型语言模型，本文使用OpenAI的GPT-3.5和等模型，在机器学习领域探索其应用。这些模型的发展使得它们在多个领域中都有着广泛的应用，包括自然语言处理、生物学、化学和计算机编程。通过对人类反馈的处理，这些模型能够执行不同的任务，并且能够根据反馈进行进一步的学习，不断提高其生成文本的质量。本文提出了一个智能代理系统，该系统将多个大型语言模型整合在一起，用于自主地设计、规划和执行科学实验。通过这种方式，这些模型的科学研究能力得到了充分展现。文中通过三个不同的例子展示了这一代理系统的自主实验能力，其中包括对催化交叉偶联反应的成功实验。这些例子表明了大型语言模型在科学研究中的潜在能力，以及它们在执行复杂实验和推理过程中的优势。然而，与之相对应的是，这类系统也存在一定的安全隐患。本文讨论了这些潜在的风险，并提出了一些防范措施，以避免可能的误用。这些措施包括对系统进行监控和调整，以及对执行实验的过程进行严格的监督和审查。通过这些措施，可以降低这些模型在科学研究中可能引发的风险。综上所述，大型语言模型在科学研究中的自主能力是一个新兴的领域，具有巨大的潜力。通过采用智能代理系统，这些模型可以自主地执行复杂的科学实验和推理过程，为科学研究带来了新的可能性和机遇。然而，我们也需要意识到这些模型可能存在的安全隐患，必须采取措施加以防范。期待未来这一领域的进一步发展，以及更多关于大型语言模型在科学研究中的应用和挑战的研究。

图5.Agent设计和执行的交叉偶联Suzuki和Sonogashira反应实验。A.代理配置概述。B.可用化合物。C.液体处理器设置。

D.解决综合问题。E.生成的协议。

Machine Translated by Google

Agent展示了解决关键科学问题的有趣方法。

开发方法的安全影响。

Agent具有很高的推理能力。

Agent表现出的最显着的推理能力是它能够根据自动生成的输出来纠正自己的代码。除了已经提到的示例外，在铃木

反应的机理研究计算期间，模型要求系统执行导入未安装的SymPy包（请参阅附录D）的代码。收到相应的回溯

后，Agent使用基本的Python修改了代码。然而，这个修改后的代码仍然没有帮助，因为它没有返回任何输出（模

型假设解释器在交互模式下使用）。认识到这一点，代理通过合并print()语句进行了最终调整。

人们越来越担心将分子机器学习模型用于有害目的的潜在滥用。具体而言，用于预测细胞毒性18以制造新毒药或使

用AlphaFold2开发新型生物武器的模型的双重用途引起了警觉。这些问题的核心是可能滥用大型语言模型和出于

双重用途或其他目的的自动化实验。

一旦确定了化合物，该模型就会尝试合成（此步骤未通过实验进行）。另一个例子涉及研究铃木反应的机制（见附

录D）。在这种情况下，该模型寻求有关反应机制的信息，并在获得各个步骤后搜索此类反应的示例。为了执行反应，

模型计算了所需的试剂量，并请求了与相应合成相关的文档页面。

该系统展示了非常高的推理能力，使其能够请求必要的信息，解决复杂的问题，并为实验设计生成高质量的代码。

OpenAI表明，在AlignmentResearchCenter进行的初始测试中，GPT‑4可以依赖其中一些功能在物理世界中

采取行动。10

我们专门解决两个关键的综合问题：非法药物和化学武器。为了评估这些风险，我们设计了一个测试集，其中包含

DEA附表I和II物质中的化合物以及已知化学武器制剂的清单。我们使用通用名称、IUPAC名称、CAS编号和

SMILES字符串将这些化合物提交给代理，以确定代理是否会进行广泛的分析和规划（图6）。

此外，我们旨在评估系统在遇到极具挑战性的问题时的性能。我们首先要求模型开发一种新型抗癌药物（请参阅附

录E）。该模型以一种合乎逻辑且有条不紊的方式进行分析：它首先询问抗癌药物发现的当前趋势，随后选择一个目

标，并请求针对这些化合物的支架。

Machine Translated by Google

剩余47页未读，继续阅读

BOTOAI

粉丝: 568
资源: 14

"大型语言模型的自主科研能力及应用范围"

大语言模型的发展趋势分析

大语言模型-大语言模型可以自我改进.zip

大规模语言模型：从理论到实践

大型语言模型在电池研究中的应用：机遇、挑战与展望

探索大型语言模型的未来：从自然语言处理到伦理挑战

大规模语言模型的新兴能力研究

探索大型语言模型：从GPT到LLaMA的演进

GPT模型全解析：语言模型的突破与应用

ChatGPT模型解析：从Bert到预训练语言模型的革命

全面整理开源大语言模型资源集

最新资源