AI的情感识别不可信任

人工智能2020-08-21 14:48:05
导读该领域的一项新评论称,面部表情与情绪可靠对应的信念是没有根据的,随着人工智能被用来做出更多关于我们生活的决定,工程师们已经找到了

该领域的一项新评论称,面部表情与情绪可靠对应的信念是没有根据的,随着人工智能被用来做出更多关于我们生活的决定,工程师们已经找到了使其更具情感智慧的方法。这意味着自动化人类自然产生的一些情感任务 - 最明显的是,看着一个人的脸并知道他们的感受。

为实现这一目标,微软,IBM和亚马逊等科技公司都出售他们所谓的“情感识别”算法,这种算法可以推断人们基于面部分析的感受。例如,如果有人皱眉,噘起嘴唇,就意味着他们生气了。如果他们的眼睛很宽,他们的眉毛就会抬起,嘴巴张得很紧,这意味着他们会害怕,等等。

客户可以通过各种方式使用这种技术,构建从寻找“愤怒”威胁的自动化监控系统到有望淘汰无聊和不感兴趣的候选人的求职面试软件。

许多科技公司出售算法,承诺他们可以根据某人的面孔可靠地阅读情绪。图像:微软

但我们可以很容易地根据他们看起来如何看待人们的感觉是有争议的,并且对该研究的一项重要的新评论表明,没有坚定的科学理由。

“公司可以说任何他们想要的东西,但数据很清楚,”东北大学心理学教授,该评论的五位作者之一Lisa Feldman Barrett告诉The Verge。“他们可以发现一个皱眉,但这与检测愤怒不是一回事。”

该评价由心理科学协会委托,并要求该领域的五位杰出科学家仔细检查证据。每位评论家都代表了情感科学领域的不同理论阵营。“我们不确定我们是否能够就数据达成共识,但我们做到了,”巴雷特说。他们花了两年时间来检查数据,审查了1000多项不同的研究。

他们的发现很详细 - 可以在这里完整阅读- 但基本的总结是,情绪以多种方式表达,这使得很难可靠地从一组简单的面部动作中推断出某人的感受。

“人们平均而言,数据显示,当他们生气时,不到30%的时间都会皱起眉头,”巴雷特说。“所以愁眉苦脸不是愤怒的表现;他们是愤怒的表达 - 许多人之一。这意味着超过70%的时间,人们生气时不会皱眉。最重要的是,当他们不生气时,他们会经常皱眉。“

“你真的希望在此基础上确定结果吗?”

反过来,这意味着使用人工智能以这种方式评估人们情绪的公司会误导消费者。“你真的希望在此基础上确定结果吗?”巴雷特说。“你想在法庭,雇用情况,医疗诊断,还是在机场......那里算法准确率只有30%的时间?”

当然,评论并不否认可能存在普通或“原型”的面部表情,也不否认我们对面部表情的交际能力的信念在社会中起着巨大的作用。(不要忘记,当我们亲眼看到人们时,我们有更多关于情绪背景的信息,而不是简单的面部分析。)

该评论认识到情绪研究领域存在着各种各样的信念。具体而言,它反驳的是通过表达可靠地“指纹识别”情绪的想法,这种理论源于20世纪60年代心理学家保罗·埃克曼(以及埃克曼自那时起开发的)的工作。

研究表明,某些面部表情与情绪之间存在强烈相关性的研究往往在方法上存在缺陷。例如,他们使用演员拉着夸张的面孔作为情感“看起来”的起点。当要求测试对象标记这些表达时,他们经常被要求从有限的情绪选择中进行选择,从而推动他们达成某种共识。

当人们被要求在脸上标注情感并且没有给出一组选择时,他们的答案会有很大差异,如图表所示。图片:Barrett等。

巴雷特说,人们直观地理解情绪比这更复杂。“当我对人们说,'有时候你会愤怒地喊,有时候你会愤怒地哭,有时候你会笑,有时你会静静地坐着,计划你的敌人的死亡,'这说服了他们,”她说。“我说,'听着,当他们生气的时候,有人因为皱眉而赢得奥斯卡奖?没有人认为这是伟大的表演。“

然而,这些微妙之处很少被出售情感分析工具的公司所承认。在市场对微软的算法,例如,该公司表示,在人工智能的进步使得其软件“认八大核心情绪状态......根据反映这些感受,普遍的面部表情”,这是确切的要求,这次审查驳斥。

当然,这不是一个新的批评。巴雷特和其他人一直警告多年来,我们的情感识别的模型过于简单。作为回应,销售这些工具的公司经常说他们的分析是基于更多的信号,而不仅仅是面部表情。困难在于知道这些信号如何平衡,如果有的话。

这个价值200亿美元的情感识别市场中的领先公司之一Affectiva表示,它正在尝试收集更多指标。例如,去年,它推出了一种工具,通过结合面部和语音分析来衡量驾驶员的情绪。其他研究人员正在研究步态分析和眼动追踪等指标。

在一份声明中,Affectiva首席执行官兼联合创始人Rana el Kaliouby表示,这次审查与该公司的工作“非常一致”。“就像本文的作者一样,我们不喜欢这个行业的天真,它注重于6种基本情绪和面部表情与情绪状态的原型一对一映射,”el Kaliouby说。“表达与情感的关系非常细微,复杂而不是原型。”

Barrett相信,通过更复杂的指标,我们将能够更准确地衡量未来的情绪。“我绝对相信这是可能的,”她说。但这并不一定会阻止目前​​有限的技术扩散。

AI非常适合在数据中查找虚假连接

特别是在机器学习的情况下,我们经常会看到用于制定决策的指标 - 不是因为它们可靠,而是因为它们可以被衡量。这是一种擅长寻找联系的技术,这可能会导致各种虚假的分析:从扫描保姆的社交媒体帖子到检测他们的“态度”,分析公司财报记录,试图预测股票价格。通常,人工智能的提及给人一种不值得信任的外表。

如果情绪识别变得普遍,那么我们就会接受它并改变我们的行为以适应其失败。就像人们现在的行为知识一样,他们在网上做的事情会被各种算法解释(例如,选择不喜欢Instagram上的某些图片,因为它会影响你的广告),我们最终可能会因为我们的夸张面部表情知道它们将如何被机器解释。这与向其他人发出信号的情况并无太大差别。

巴雷特说,或许从评论中最重要的一点是,我们需要以更复杂的方式思考情绪。情绪的表达是多种多样的,复杂的和情境的。她将所需的思维变化与查尔斯达尔文关于物种性质的研究以及他的研究如何推翻了对动物王国的简单化观点进行了比较。

“达尔文认识到物种的生物类别没有本质,它是一类高度可变的个体,”巴雷特说。“情绪类别完全相同。”

免责声明:本文由用户上传,如有侵权请联系删除!