没有合适的资源?快使用搜索试试~ 我知道了~
工程7(2021)706新闻亮点人工智能破解生物学50年大挑战肖恩高级技术作家2020年11月下旬,谷歌母公司Alphabet旗下总部位于伦敦、专注于人工智能(AI)的子公司DeepMind Technologies这一壮举遇到了生物学50年来的重大挑战,即预测蛋白质如何折叠的异常困难的问题。预计这一进展将对药物开发和新兴的蛋白质设计领域产生重大影响,甚至可能有助于应对2019年冠状病毒病(COVID-19)大流行[2],特别是随着严重急性呼吸综合征冠状病毒2(SARS-CoV-2)变体的迅速出现[3]。‘‘Protein ‘‘We have always hypothesised that AI should behelpful to make these kinds of big scientific break- throughsmore蛋白质是一种大而复杂的分子,在生物世界的各个方面都起着关键作用蛋白质的形状决定了它们的功能:血红蛋白运输营养,酶催化化学反应,胶原蛋白提供结构,胰岛素调节血糖,抗体提供免疫力。这些蛋白质和所有其他蛋白质都是由标准遗传密码中的20个氨基酸组成的,它们以长链连接在一起。蛋白质由生物体或通过合成过程一个氨基酸一个氨基酸地构建,自然地扭曲和折叠在一起形成复杂的形状,充满了弯曲,螺旋和片。例如,抗体蛋白是相反,有害的基因突变可能导致产生错误折叠的非功能性蛋白质,例如导致囊性纤维化的蛋白质。生产蛋白质的密码包含在脱氧核糖核酸(DNA)中。但是,尽管DNA测序揭示了给定蛋白质所包含的氨基酸序列,但它并没有告诉它们如何蛋白质的序列越大,预测其形状就越困难。理论上,典型蛋白质的链可以折叠成天文数字的任何构象,使蛮力计算的尝试成为徒劳[4]。蛋白质折叠的挑战起源于1972年,当时,在接受诺贝尔化学奖时,美国生物化学家Christian Anfinsen宣称,蛋白质的氨基酸序列应该足以在特定环境中确定其折叠形状[5]。然而,几十年来,准确确定感兴趣的蛋白质形状的唯一方法是使用昂贵而艰苦的方法,如核磁共振和X射线晶体学,以及最近的冷冻电子显微镜。这可能需要数年的实验工作来描绘单一蛋白质的形状,并不能保证成功。1994年,为了围绕这个问题联合全球科学家社区,美国马里兰大学罗克维尔分校的细胞生物学和分子遗传学教授John Moult及其同事创建了一个大规模实验,以评估生成蛋白质结构的计算方法[6]。这项工作成为两年一度的结构预测关键评估(CASP )活动,Hassabis称之为“CASP竞赛有三个滚动阶段:①收集大约100个蛋白质靶点,其形状最近被实验室工作发现,但至关重要的是,尚未发表;②向世界各地的团队提供这些靶点的基因序列,然后他们开始使用软件系统预测它们的形状;③盲目评估提交的预测。CASP主要使用一种称为“全球距离测试”(GDT)的方法来判断预测形状的准确性,该方法的范围从0到100。Moult说,90分左右的分数与通过实验获得的结果相当。自1994年以来的进展一直稳定但缓慢-直到2018年的CASP 13,当时DeepMind首次进入AlphaFold的早期版本[7]。 该团队以很大的优势获胜,震惊了CASP社区,但AlphaFold的预测仍然远离目标蛋白的实际结构,GDT中位数为59(图10)。①的人。然而,对于2020年的CASP14,DeepMind带着一个完全改造的AlphaFold回来了,这一次的结果令人震惊。“这是非凡的,”Moult说。“你看到一个令人惊讶的预测进来,你想,‘这里发生了什么?’当你有三到四个结构预测是令人难以置信的准确,你意识到一些非常重要的事情发生了。AlphaFold在最难的类别中得分为87 GDT,所有蛋白质靶标的中位数得分为92.4 GDT(图2)[8]。该系统https://doi.org/10.1016/j.eng.2021.04.0032095-8099/©2021 THE CONDITOR.由爱思唯尔有限公司代表中国工程院和高等教育出版社有限公司出版。这是一篇基于CC BY-NC-ND许可证的开放获取文章(http://creativecommons.org/licenses/by-nc-nd/4.0/)。可从ScienceDirect获取目录列表工程杂志首页:www.elsevier.com/locate/engS.工程7(2021)706707Fig. 1. 获胜团队预测的准确性中位数DeepMind图片来源:DeepMind,经许可。图二、AlphaFold预测的作为CASP14一部分的几种蛋白质的结构(蓝色)叠加在实验确定的结构(绿色)上。他们是非常接近的比赛。RNA:核糖核酸。图片来源:DeepMind,经许可。一个原子的宽度为了实现这一妙招,DeepMind团队开发了一种新颖的基于注意力的神经网络系统[9]。在机器学习中,深入的技术细节这个深度学习系统还没有被分享,但预计今年晚些时候会有同行评议的论文 AlphaFold(图第三章[1]使用来自蛋白质数据库(PDB)的公开可用数据进行训练-该数据库包含约175,000种蛋白质的结构根据DeepMind团队的说法,训练期间需要大约16个Google TPUv 3协处理器(相当于100莫尔特说,他听说神经网络被认为是美化了的模式识别,但Alpha-Fold能够从训练中提取出的原子级知识的程度是它所达到的抽象水平是深刻的。这就好像机器在外星人的意义上已经学会了物理学。它可以采取任何涉及蛋白质类型结构的情况,并在原子水平上得到正确的你不能仅仅通过在训练数据中搜索一组模式来做到这一点这一突破为整个生物学带来了机遇,但药物发现可能是它最直接的影响。大多数药物通过与体内蛋白质结合,引发它们功能的变化而起作用有了像Alpha-Fold这样的机器学习系统,应该可以快速确定感兴趣的蛋白质的形状,然后设计药物-或重新利用现有的药物-以有效地结合这些蛋白质。例如,随着2020年初冠状病毒大流行的规模变得明显,后来作为CASP 14的一部分,DeepMind获取了构成SARS-CoV-2病毒一部分的几种蛋白质的基因序列,并提供了结构预测,这些预测随后在很大程度上得到了实验的证实。这项工作有可能加快对抗这种疾病的药物的设计。事实上,蛋白质设计是形状预测的另一面:一旦机器对支撑蛋白质折叠的原子过程有了明确的理解,设计折叠成所需形状的蛋白质就变得更容易了。‘‘We’ve been using current protein design methods to developCOVID-19 therapeutics, vaccines, and sensors that look verypromising and are already in, or headed for, clinical trials,” saidDavid Baker, director of the Institute for Protein Design, based atthe ‘‘With improved protein像AlphaFold这样的技术也可以用来探索蛋白质和酶,这些蛋白质和酶可以用来分解工业废物或旧塑料,或者有效地从大气中吸收碳。图三. AlphaFold架构概述。DeepMind尚未提供有关其系统的深入细节,但描述了“折叠的蛋白质如何MSA:多序列比对; 3D:三维。图片来源:DeepMind,经许可。S.工程7(2021)706708结构生物学是巨大的,‘‘These approaches will have importantmedical applications and lead to technological advances that wecurrently cannot伦敦大学学院生物信息学教授、生物信息学小组负责人大卫·琼斯提出了一个更为谨慎的观点 ‘‘But I am not amongst the people whobelieve we will have new 重要的是要在许多不同的条件下测试如此复杂的系统,然后我们才能确定它的能力或局限性。引用[1] AlphaFold:生物学50年大挑战的解决方案伦敦:DeepMind; 2020年11月30日[ 引 用 于 2021 年 2 月 4 日 ] 。 可 从 以 下 网 址 获 得 : https ://www.example.comdeepmind.com/blog/article/alphafold-a-solution-to-a-50-year-old-grand-challenge-in-biology。[2] 卡拉威湾“它将改变一切”:DeepMind的AI在解决蛋白质结构方面取得了巨大的飞跃。Nature2020;588:203-4.[3] 关于导致COVID-19的病毒变体[互联网]。亚特兰大:疾病控制和预防中心;[更新2021 年 2 月 12 日 ; 引 用 2021 年 2 月 26 日 ] 。 可 查 阅 :https://www.cdc.gov/coronavirus/2019-ncov/transmission/variant.html。[4] Dill KA,Ozkan SB,Shell MS,Weikl TR.蛋白质折叠的问题。Ann RevBiophys2008;37:289-316.[5] 蛋白质折叠和热力学假说,1950-1962。 [互联网]。华盛顿特区:美国国家医学图 书 馆 ;[ 引 自 2021 年 2 月 18 日 ] 。 可 从 以 下 网 址 获 得 :https://profiles.nlm.nih.gov/spotlight/kk/feature/蛋白质。[6] Moult J,Pedersen JT,Judson R,Fidelis KA.评估蛋白质结构预测方法的大规模实验。蛋白质结构功能生物信息1995;23(3):ii-v.[7] 王文,等.基于深度学习的蛋白质结构预测方法的研究.北京:科学出版社,2003,27(1):100 - 120. Nature2020;577:706-10.[8] 第14届蛋白质结构预测技术关键评估社区实验[互联网]。戴维斯:加州大学戴维斯分校;c2007-2020[引用2021年2月18日]。网址:predictioncenter.org/casp14/results.cgi? groups_id=205& submit=提交。[9] Jumper J,Evans R,Pritzel A,Green T,Figurnov M,Tunyasuvunakool K,et al.High accuracy protein structure prediction using deep learning.在:蛋白质结构预测技术的关键评估(CASP 14),摘要书; 2020年11月30日2020年。[10] 与COVID-19相关的蛋白质结构的计算预测[互联网]。伦敦:DeepMind; 2020年8月4日[引用于2021年2月18日]。可查阅:https://deepmind.com/research/open-source/computational-predictions-of-protein-structures-associated-with-COVID-19。[11] Cao L,Goreshnik I,Coventry B,Case JB,Miller L,Kozodoy L,et al. Denovodesign of picomolar SARS-CoV-2 miniprotein inhibitors. Science 2020;370(6515):426-31.
下载后可阅读完整内容,剩余1页未读,立即下载
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://profile-avatar.csdnimg.cn/default.jpg!1)
cpongm
- 粉丝: 4
- 资源: 2万+
上传资源 快速赚钱
我的内容管理 收起
我的资源 快来上传第一个资源
我的收益
登录查看自己的收益我的积分 登录查看自己的积分
我的C币 登录后查看C币余额
我的收藏
我的下载
下载帮助
![](https://csdnimg.cn/release/wenkucmsfe/public/img/voice.245cc511.png)
会员权益专享
最新资源
- 京瓷TASKalfa系列维修手册:安全与操作指南
- 小波变换在视频压缩中的应用
- Microsoft OfficeXP详解:WordXP、ExcelXP和PowerPointXP
- 雀巢在线媒介投放策划:门户网站与广告效果分析
- 用友NC-V56供应链功能升级详解(84页)
- 计算机病毒与防御策略探索
- 企业网NAT技术实践:2022年部署互联网出口策略
- 软件测试面试必备:概念、原则与常见问题解析
- 2022年Windows IIS服务器内外网配置详解与Serv-U FTP服务器安装
- 中国联通:企业级ICT转型与创新实践
- C#图形图像编程深入解析:GDI+与多媒体应用
- Xilinx AXI Interconnect v2.1用户指南
- DIY编程电缆全攻略:接口类型与自制指南
- 电脑维护与硬盘数据恢复指南
- 计算机网络技术专业剖析:人才培养与改革
- 量化多因子指数增强策略:微观视角的实证分析
资源上传下载、课程学习等过程中有任何疑问或建议,欢迎提出宝贵意见哦~我们会及时处理!
点击此处反馈
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035711.png)
![](https://img-home.csdnimg.cn/images/20220527035111.png)
安全验证
文档复制为VIP权益,开通VIP直接复制
![](https://csdnimg.cn/release/wenkucmsfe/public/img/green-success.6a4acb44.png)