AI学习化学语言来预测如何制作药物
剑桥大学的研究人员已经证明,算法能够以超过90%的准确度预测复杂化学反应的结果,优于经过培训的化学家。该算法还向化学家展示了如何制造目标化合物,为所需目的地提供化学“图谱”。研究结果发表在ACS Central ScienceandChemical Communications期刊的两项研究中。
药物发现和材料科学的一个主要挑战是找到通过化学连接更简单的构建块来制造复杂的有机分子的方法。问题是这些构建块经常以意想不到的方式作出反应。
“制造分子通常被描述为通过反复试验实现的艺术,因为我们对化学反应性的理解远未完成,”剑桥卡文迪什实验室的Alpha Lee博士说。“机器学习算法可以更好地理解化学,因为它们从数百万种已发表的化学反应中提取反应模式,这是化学家无法做到的。”
Lee和他的团队开发的算法使用模式识别工具,通过对专利中公布的数百万反应模型进行训练,识别分子中的化学基团如何反应。
研究人员将化学反应预测视为机器翻译问题。反应分子被认为是一种“语言”,而产品被认为是一种不同的语言。然后,模型使用文本中的模式来学习如何在两种语言之间“翻译”。
使用这种方法,该模型在预测看不见的化学反应的正确产品方面达到了90%的准确度,而受过训练的人类化学家的准确率约为80%。研究人员表示,该模型足够准确,可以检测数据中的错误并正确预测过多的困难反应。
该模型也知道它不知道的内容。它产生不确定性评分,消除了错误的预测,准确率为89%。由于实验耗时,准确的预测对于避免追求最终以失败告终的昂贵实验途径至关重要。
在第二项研究中,Lee和他的团队与生物制药公司Pfizer合作,证明了该方法在药物发现方面的实际潜力。
研究人员表明,在对已发表的化学研究进行培训时,该模型可以根据实验室笔记本准确预测反应,表明该模型已经学会了化学规则并可以将其应用于药物发现设置。
该团队还表明,该模型可以预测导致所需产品的反应顺序。他们将这种方法应用于多种类似药物的分子,表明它预测的步骤在化学上是合理的。该技术可以显着缩短临床前药物发现的时间,因为它为药物化学家提供了从何处开始的蓝图。
“我们的平台就像一个用于化学的GPS,”李说,他也是圣凯瑟琳学院的研究员。“它告诉化学家,反应是进行还是进行,以及如何通过反应途径来制造新分子。”
剑桥研究人员目前正在利用这种反应预测技术开发一个完整的平台,在药物发现和材料发现中建立设计 - 制造 - 测试周期:预测有前途的生物活性分子,制造这些复杂有机分子的方法,以及选择实验信息量最大的。研究人员正在努力从模型中提取化学见解,试图了解人类没有学到的东西。