AlphaFold在预测蛋白质结构方面颇有成就

科技2020-10-14 08:06:41
导读玩家们鼓掌、说Whoo之类的词、在桌子上敲塑料刀,并享受以人工智能为主要行为的最好的周末,感谢AI在游戏中释放。《连线》英国版科学编辑

玩家们鼓掌、说Whoo之类的词、在桌子上敲塑料刀,并享受以人工智能为主要行为的最好的周末,感谢AI在游戏中释放。

《连线》英国版科学编辑马特•雷诺兹(Matt Reynolds)研究了DeepMind对人工智能里程碑的影响:“它击败了围棋冠军,打败了职业星际争霸玩家,并将注意力转向国际象棋和围棋。”

让比赛继续下去,但是严肃的东西必须严肃地发光。简而言之,我们可以钦佩的是,由于DeepMind的研究,以科学发现为目的的人工智能的释放变得尤其活跃。

科技观察人士本周对显示人工智能优势的研究论文发表了评论。“随着人工智能作为一个领域的成熟(并且已经没有视频游戏可以征服了),它可能会取得更多这样的成就:在重要的研究领域取得扎实的进步。”

发表在《自然》杂志上的一篇研究论文成为了即时新闻,这篇论文探讨了人工智能如何被用于预测蛋白质折叠。VentureBeat指的是逐渐接近目标的艰巨挑战。

这篇论文名为《利用深度学习的潜力改进蛋白质结构预测》,发表在12月15日的《自然》杂志网络版上。

DeepMind系统被称为AlphaFold。雷诺兹对AlphaFold和数据集有一个有趣的注意:“蛋白质折叠领域也很适合训练人工智能代理。它拥有一个庞大的数据库——蛋白质数据库,一个包含15万个蛋白质的三维结构和基因组成的储存库,用来训练DeepMind的蛋白质结构预测系统AlphaFold。”

这篇论文探讨了DeepMind迄今在利用人工智能预测蛋白质折叠方面取得的成就。正如Vox的凯尔西•派珀(Kelsey Piper)所言,蛋白质折叠的重要意义在于,它是“开发新药的关键问题”。

DeepMind团队的三名成员,Andrew Senior、John jump和Demis Hassabis在1月15日发表了一篇博客文章,解释了蛋白质结构、蛋白质折叠挑战以及他们想要实现的目标。

正如Levinthal的悖论所证明的那样,在得到真正的三维结构之前,随机列举出一种典型蛋白质的所有可能结构需要的时间比已知宇宙的年龄还要长——然而蛋白质本身会在几毫秒内自动折叠。预测这些链将如何折叠成复杂的蛋白质3-D结构,这就是所谓的“蛋白质折叠问题”——科学家们已经研究了几十年的一个挑战。”

研究小组证明,他们可以训练一个神经网络来准确预测“残差对之间的距离,这比接触预测能传达更多的结构信息。”

他们谈到了通过“一个简单的梯度下降算法生成结构,而不需要复杂的采样过程”来进行优化。

派珀说,蛋白质波尔丁的重大意义在于,它是“开发新药的关键问题”。所以如何?为什么“形状”如此重要?“蛋白质的形状可以预测它们与其他物质的相互作用,因此了解蛋白质折叠对药物发现至关重要,甚至可以用于开发新的制造工艺,”派珀说。

DeepMind的博客称,“人们认为蛋白质的形式决定了它的功能。一旦了解了蛋白质的形状,就可以推测它在细胞内的作用,科学家可以开发出针对这种蛋白质独特形状的药物。”

AlphaFold可以帮助研究人员更好地了解蛋白质的功能和故障。

伦敦大学学院生物信息学小组组长戴维·琼斯在《VentureBeat》中引用了一句值得注意的话,他为DeepMind团队提供了该项目的部分建议:

“实验技术来确定蛋白质结构是耗时和昂贵的,这是一个巨大的需求更好的计算机算法来计算蛋白质的结构直接从基因序列,编码,和DeepMind的工作在分子生物学应用人工智能这一长期问题是一个明确的进步。”

什么样的实验技术是耗时且昂贵的?该博客提到了低温电子显微镜、核磁共振和x射线晶体学,每一种方法都取决于试验和错误,“这可能需要多年的工作,而且每个蛋白质结构要花费数万或数十万美元。”

VentureBeat的凯尔•威格斯(Kyle Wiggers)表示:“有了AlphaFold, DeepMind的研究团队专注于从头开始建模目标形状的问题,而没有把已解决的蛋白质作为模板。”

《自然》是如何定义蛋白质折叠的:“蛋白质折叠是蛋白质实现其成熟功能(天然)三级结构的过程,通常是共同翻译的开始。蛋白质折叠需要陪伴,而且通常要逐步建立常规二级和supersecondary结构,即α-helicesβ-sheets,折叠迅速,稳定通过氢键和二硫化物桥梁,然后三级结构。”

早在今年7月,《自然》杂志就已经注意到“破解生物学最大挑战之一——根据氨基酸序列预测蛋白质的三维结构——的竞赛正在加剧,这要归功于人工智能(AI)的新方法。”

DeepMind的博客文章说,他们提供了代码(GitHub),并提供了链接,任何人想要了解更多或复制他们的结果。

在他们的博客中,他们阐述了为什么他们的系统很重要:“我们的系统,AlphaFold……建立在使用大型基因组数据集预测蛋白质结构的数十年前期研究的基础上。AlphaFold生成的蛋白质三维模型比之前的任何模型都精确得多。”

展望未来,AlphaFold这样的工具可能会帮助罕见疾病研究人员快速、经济地预测他们感兴趣的蛋白质的形状,并最终帮助他们有效地发现药物,同时减少与实验相关的成本。

罕见病研究并不是唯一能从他们所取得的成就中受益的领域。这个博客讨论了像塑料和石油这样的污染物;蛋白质设计使生物可降解酶的发展有助于以对环境更友好的方式分解废物。

“事实上,研究人员已经开始利用细菌来分泌蛋白质,使废物能够被生物降解,而且更容易处理。”

免责声明:本文由用户上传,如有侵权请联系删除!