机器学习在新聚合物发现中的成功应用
作为人工智能(AI)如何加速新材料发现的一个有力例子,日本科学家设计并验证了具有高导热性的聚合物 - 这一特性将成为热管理的关键,例如,在第五阶段 - 一代(5G)移动通信技术。他们的研究强调了机器学习方法相对于传统的高性能材料搜索方法的巨大优势。
发现过程。ML工作流程包括两个不同的预测步骤; 前向和后向预测。前向预测的目的是创建一组预测模型,其描述作为组成重复单元中的化学结构的函数的各种聚合物性质(例如,热导率,玻璃化转变温度)。在这里,一个称为转移学习的ML框架被用来克服热导率数据有限的问题:某些代理属性的预测模型在给定的大数据集上进行了预训练,然后使用以下方法对预训练模型进行了微调。关于目标财产的有限数据。反转训练的前向模型,我们得出了一个由所需属性要求决定的后向模型。通过解决这个反问题,在计算上可以创建具有所需特性的材料。图片:东京工业大学。
包括Ryo Yoshida(信息与系统研究组织统计数学研究所[ISM]创意设计与制造数据科学中心主任)的联合研究小组,Sunko Junko(材料与化学学院教授)技术,东京工业大学[东京技术])和徐一斌(热管理和热电材料集团组长,信息集成材料研究中心,材料数据和集成系统研究和服务部[MaDIS],NIMS)已经证明了机器学习(ML)的有希望的应用 - 机器人学习是一种AI,它使计算机能够从给定的数据中“学习” - 用于发现创新材料。
研究人员在开放获取期刊npj计算材料中报告了他们的研究结果,他们的ML方法涉及“转移学习”,即使从极小的数据集中也可以发现具有所需特性的材料。
该研究利用了PoLyInfo的聚合物性能数据集,PoLyInfo是世界上最大的NIMS聚合物数据库。尽管尺寸巨大,但PoLyInfo对聚合物的传热性能数据有限。为了根据给定的有限数据预测传热特性,对代理属性的ML模型进行了预先训练,其中有足够的数据可用于相关任务; 这些预先训练的模型捕获了与目标任务相关的共同特征。即使对于非常小的数据集,在目标任务上重新利用这种机器获取的特征也产生了出色的预测性能,好像经验丰富的人类专家即使对于经验较少的任务也可以做出合理的推理。该团队将该模型与专门设计的ML算法结合起来进行计算分子设计,这被称为先前由吉田和他的同事开发的iQSPR算法。应用这种技术启用了识别!
成千上万有希望的“虚拟”聚合物。
从这大量候选物中,根据其易于合成和加工选择了三种聚合物。
测试证实,新型聚合物的导热系数高达0.41瓦/米 - 开尔文(W / mK)。这个数字比典型的聚酰亚胺高80%,聚酰亚胺是一组常用的聚合物,自20世纪50年代以来大量生产用于从燃料电池到炊具的应用。
通过验证计算设计聚合物的传热性能,该研究代表了快速,经济,ML支持的材料设计方法的关键突破。它还展示了该团队在数据科学,有机合成和先进测量技术方面的综合专业知识。
Yoshida评论说,许多方面仍有待探索,例如通过添加更合适的描述符来“训练”计算系统以处理有限的数据。“聚合物或软材料设计的机器学习是一个具有挑战性但前景广阔的领域,因为这些材料具有与金属和陶瓷不同的特性,并且现有理论尚未完全预测,”他说。
这项研究是发现其他创新材料的起点,Morikawa补充道:“我们希望尝试创建一个ML驱动的高通量计算系统,为超越5G时代的应用设计下一代软材料。通过我们的项目,我们的目标不仅是追求材料信息学的发展,而且还有助于材料科学的基本进步,特别是在声子工程领域。“
这项工作是作为“信息集成材料研究”计划(MI 2 I)的一部分进行的,该计划是由日本科学技术厅(JST)选择的开放式创新加速器,作为启动创新中心的支持计划,由NIMS实施。