训练有素的AI阅读科学论文如何预测未来发现

人工智能2020-08-15 22:52:27
导读 大约70年前,著名的数学家,代码破坏者和计算机科学家艾伦·图灵(Alan Turing)问:机器能思考吗?如今,一些专家毫不怀疑,人工智能(AI)

大约70年前,著名的数学家,代码破坏者和计算机科学家艾伦·图灵(Alan Turing)问:“机器能思考吗?”如今,一些专家毫不怀疑,人工智能(AI)很快将能够开发人类拥有的那种通用智能。但是其他人则认为机器永远无法达到预期的目标。尽管在某些任务上,人工智能已经可以超越人类,就像计算器一样,但它们却无法教给人类创造力。

毕竟,我们的创造力有时是出于热情和直觉而不是逻辑和证据的驱使,使我们能够做出惊人的发现-从疫苗到基本粒子。当然,人工智能将永远无法竞争吗?好吧,事实证明他们可能会这么做。最近在《自然》杂志上发表的一篇论文指出,人工智能现在已经能够通过简单地从研究出版物中提取有意义的数据来预测未来的科学发现。

语言与思维有着深厚的联系,它已经塑造了人类社会,人际关系,并最终影响了智力。因此,人工智能研究的圣杯是对人类语言的所有细微差别的充分理解也就不足为奇了。自然语言处理(NLP)是更大的一部分(称为机器学习)的一部分,旨在评估,提取和评估文本数据中的信息。

儿童通过反复试验与周围的世界互动学习。学习如何骑自行车经常会遇到一些颠簸和跌落。换句话说,我们犯了错误并从中学习。这恰恰是机器学习的运行方式,有时还需要一些额外的“教育”输入(监督的机器学习)。

例如,AI可以通过从许多单独的示例中构建对象的图片来学习识别图像中的对象。在这里,人类必须向其显示是否包含该物体的图像。然后,计算机对是否会做出猜测,并根据猜测的准确性调整统计模型(由人类判断)。但是,我们也可以让计算机程序自己完成所有相关的学习(无监督机器学习)。在这里,AI自动开始能够检测数据中的模式。无论哪种情况,计算机程序都需要通过评估错误程度来找到解决方案,然后尝试对其进行调整以最大程度地减少此类错误。

假设我们想了解与特定材料有关的一些特性。显而易见的步骤是从书籍,网页和任何其他适当的资源中搜索信息。但是,这很耗时,因为它可能涉及数小时的网络搜索,阅读文章和专业文献。NLP可以帮助我们。通过复杂的方法和技术,计算机程序可以从大型文本数据集中识别概念,相互关系,一般主题和特定属性。

在这项新研究中,人工智能学会了通过无监督学习从科学文献中检索信息。这具有显着的含义。到目前为止,大多数基于NLP的自动化自动方法都受到监督,需要人工输入。尽管与纯手工方法相比有所改进,但这仍然是一项劳动密集型工作。

但是,在这项新研究中,研究人员创建了一个可以独立准确地识别和提取信息的系统。它使用了基于数据统计和几何特性的复杂技术来识别化学名称,概念和结构。这是基于约150万篇有关材料科学的科学论文摘要。

然后,机器学习程序会根据诸如“元素”,“能量学”和“粘合剂”之类的特定特征对数据中的单词进行分类。例如,“热”被归类为“能量学”的一部分,“气体”被归类为“元素”。这有助于将具有磁性类型和与其他材料相似性的某些化合物连接起来,从而提供了在不需要人工干预的情况下单词如何关联的见解。

科学发现

这种方法可以捕获复杂的关系并识别不同的信息层,这实际上是人类无法实现的。与科学家目前可以预测的相比,它提前提供了深刻的见解。实际上,人工智能可以在实际发现前几年为功能性应用推荐材料。有五种这样的预测,所有这些预测都是基于2009年之前发表的论文。例如,AI设法识别出一种称为CsAgGa2Se4as的物质作为热电材料,科学家在2012年才发现了。因此,如果AI出现在2009年左右,这可能会加快发现速度。

它通过将化合物与诸如“硫族化物”(包含“硫族元素”,例如硫或硒的材料),“光电”(发出,检测和控制光的电子设备)和“光伏应用”等词联系起来做出预测。许多热电材料都具有这种特性,而AI很快证明了这一点。

这表明有关未来发现的潜在知识在很大程度上已嵌入过去的出版物中。人工智能系统变得越来越独立。没有什么可担心的。它们可以极大地帮助我们浏览由人类活动不断产生的大量数据和信息。尽管与隐私和安全有关,但人工智能正在改变我们的社会。我相信它将引导我们做出更好的决策,改善我们的日常生活,并最终使我们变得更聪明。

免责声明:本文由用户上传,如有侵权请联系删除!