Agent展示了解决关键科学问题的有趣方法。
开发方法的安全影响。
Agent具有很高的推理能力。
Agent表现出的最显着的推理能力是它能够根据自动生成的输出来纠正自己的代码。除了已经提到的示例外,在铃木
反应的机理研究计算期间,模型要求系统执行导入未安装的SymPy包(请参阅附录D)的代码。收到相应的回溯
后,Agent使用基本的Python修改了代码。然而,这个修改后的代码仍然没有帮助,因为它没有返回任何输出(模
型假设解释器在交互模式下使用)。认识到这一点,代理通过合并print()语句进行了最终调整。
人们越来越担心将分子机器学习模型用于有害目的的潜在滥用。具体而言,用于预测细胞毒性18以制造新毒药或使
用AlphaFold2开发新型生物武器的模型的双重用途引起了警觉。这些问题的核心是可能滥用大型语言模型和出于
双重用途或其他目的的自动化实验。
一旦确定了化合物,该模型就会尝试合成(此步骤未通过实验进行)。另一个例子涉及研究铃木反应的机制(见附
录D)。在这种情况下,该模型寻求有关反应机制的信息,并在获得各个步骤后搜索此类反应的示例。为了执行反应,
模型计算了所需的试剂量,并请求了与相应合成相关的文档页面。
该系统展示了非常高的推理能力,使其能够请求必要的信息,解决复杂的问题,并为实验设计生成高质量的代码。
OpenAI表明,在AlignmentResearchCenter进行的初始测试中,GPT‑4可以依赖其中一些功能在物理世界中
采取行动。10
我们专门解决两个关键的综合问题:非法药物和化学武器。为了评估这些风险,我们设计了一个测试集,其中包含
DEA附表I和II物质中的化合物以及已知化学武器制剂的清单。我们使用通用名称、IUPAC名称、CAS编号和
SMILES字符串将这些化合物提交给代理,以确定代理是否会进行广泛的分析和规划(图6)。
10
此外,我们旨在评估系统在遇到极具挑战性的问题时的性能。我们首先要求模型开发一种新型抗癌药物(请参阅附
录E)。该模型以一种合乎逻辑且有条不紊的方式进行分析:它首先询问抗癌药物发现的当前趋势,随后选择一个目
标,并请求针对这些化合物的支架。
Machine Translated by Google