研究人员探索自然语言处理以评估国际象棋动作

科技2020-08-26 06:29:40
导读国际象棋和人工智能再次出现在新闻中,这次是关于通过自然语言处理(NLP)探索国际象棋模型的团队的报道。学习机制是

国际象棋和人工智能再次出现在新闻中,这次是关于通过自然语言处理(NLP)探索国际象棋模型的团队的报道。学习机制是国际象棋喋喋不休 - 精心挑选的聊天。他们预先训练了与国际象棋动作相关的评论情绪。情绪引导了代理人的决策。

他们产生的国际象棋算法旨在通过分析专家评论员的反应来评估国际象棋动作的质量。

伦敦大学学院的三位研究人员写了一篇论文,描述了他们的方法和结果。Isaac Kamlish,Isaac Chocron和Nicholas McCarthy写了“SentiMATE:学习通过自然语言处理来玩国际象棋”,它正在arXiv上。该文件于上个月提交。

“我们推出SentiMATE,一种新颖的国际象棋端到端深度学习模式,采用自然语言处理,旨在学习评估运动质量的有效评估功能。该功能是根据与训练动作相关的评论情绪进行预先训练的,用于指导和优化代理人的游戏决策。“

不要邀请AlphaZero和这个NLP模型参加同一个聚会; 他们会呆在房间的两边。研究人员写道,Deep Mind的AlphaZero在经过数百万次自我游戏并使用数千个Tensor Processing Units(TPU)之后取得了成功。新研究并非如此。

相反,他们说,他们的目标是“通过使用自然语言处理来评估个人运动的质量......来自不同国际象棋网站的数据被删除,其中包括有关正在采取的行动的信息,以及对定性评估由各种国际象棋选手撰写的评论形式的动作本身;导致一个大型的动作数据库,带有注释注释。“

“它通过分析专家评论员的反应来评估国际象棋动作的质量,” 麻省理工学院技术评论的 Will Knight说。

他补充说,研究人员修剪了与高质量动作无关的评论以及过于含糊不清的例子。“然后他们使用了一种特殊类型的递归神经网络和单词嵌入(一种基于其意义连接单词的数学技术),在另一种用于分析语言的最先进模型上进行训练。”

该算法称为SentiMATE,它自己制定了国际象棋的基本规则以及几种关键策略 - 包括分叉和铸造。

该团队发现SentiMATE能够“基于预先训练的情绪评估功能来评估国际象棋动作”。他们的结论是,有强有力的证据支持自然语言处理用于训练国际象棋引擎中的评估功能。

他们解决方案的表现并不那么引人注目。奈特说,“它未能一直击败一些传统的国际象棋机器人。” 但是,这不应该分散SentiMATE工作的事实及其工作方式:

“SentiMATE让研究人员感到惊讶,因为它有能力制定国际象棋的一些基本原则以及几个关键策略,例如分叉(当两件或多件同时受到威胁时)和铸造(当国王和城堡都移动到作者说,在董事会的背后更具防守地位。

重要的是要努力设计这样一个程序:语言是否可以用比传统方法更少的练习数据来教授如何下象棋?

ZME Science的 Tibi Puiu 考虑到了这一点:

“只是这一次,他们的机器学习计划没有练习数百万游戏来掌握国际象棋,而是分析了专家评论员的语言。有一天,研究人员说,类似的方法可以让机器破译情感语言并获得可能具备的技能。否则无法通过'蛮力'进入。“

至于模型不是超级国际象棋冠军,他说,“高级别的表现不是它的目标。在SentiMATE闪耀的地方在于它使用语言获得技能而不是练习它的能力。”

在他们的论文中,作者谈到了支持他们研究的最重要的数据集。“在根据评论对数据集进行清理和分类,对国际象棋移动进行比较,并将情感分析应用于评论时,我们向SentiChess提供了以比特格式表示的15,000张国际象棋移动的数据集,以及他们的评论和情绪评估。此数据集在希望进一步发展基于情感的国际象棋模型和统计移动分析的工作。“

展望未来,Will Knight表示游戏相关的聊天可以帮助AI程序学会以新的方式玩游戏。除了象棋之外,“同样的技术可以让机器使用我们语言的情感内容来掌握各种实际任务。”

免责声明:本文由用户上传,如有侵权请联系删除!