谷歌在谷歌翻译中首次推出了解决偏见的人工智能

科技2020-08-29 18:31:47
导读

Google今天宣布在Google翻译中发布英语到西班牙语以及芬兰语,匈牙利语和波斯语到英语的性别专用翻译,这些翻译利用新的范例来通过重写或后期编辑初始翻译来解决性别偏见。这家科技巨头声称,这种方法比支持Google Translate的针对性别的土耳其语到英语翻译的早期技术更具可扩展性,主要是因为它不依赖于数据密集型的性别中立检测器。

Google Research高级软件工程师梅尔文·约翰逊(Melvin Johnson)写道:“自最初发布以来,我们已经取得了重大进展,不仅提高了按性别划分的翻译质量,还将其扩展到另外4种语言对。”“我们致力于进一步解决Google Translate中的性别偏见,并计划将这项工作扩展到文档级翻译。”

正如约翰逊所解释的那样,用于土耳其语到英语性别特定翻译的旧分类器很费力地适应新语言,但未能使用神经机器翻译(NMT)系统独立生成男性和女性翻译。而且,它无法显示多达40%的合格查询的针对性别的翻译,因为除性别相关现象外,这两种翻译通常不完全相同。

相比之下,新的基于重写的方法首先生成翻译,然后对其进行审阅,以识别性别中立的源短语产生特定性别翻译的实例。如果真是如此,那么句子级的重写者会选择另一种性别翻译,然后对第一和重写译文进行审核,以确保唯一的区别是性别。

根据Google的说法,构建重写器涉及生成数百万个由成对短语组成的训练示例,每个短语都包含男性和女性翻译。由于数据不易获得,因此Google Translate团队不得不从大型单语数据集开始,通过将男性代词从男性转换为女性(或相反)来提出候选者重写。对于这种重写语料库,工程师采用了内部语言模型,该模型对数百万个英语句子进行了训练,以选择最佳人选,从而将训练数据从男性输入转换为女性输出,反之亦然。

免责声明:本文由用户上传,如有侵权请联系删除!