亚马逊工作人员正在听你告诉Alexa的内容
该公司在全球拥有数千名员工,以帮助改进Alexa数字助理,为其Echo扬声器系列提供动力。该团队收听Echo业主家中和办公室录制的录音。录音被转录,注释,然后反馈到软件中,作为消除Alexa对人类语音理解的差距并帮助它更好地响应命令的努力的一部分。
由7名参与该计划的人员描述的Alexa语音审核流程突出了培训软件算法中经常被忽视的人类角色。在营销材料中亚马逊表示,Alexa“生活在云端,并且总是越来越聪明。”但是,就像许多为了从经验中学习而构建的软件工具一样,人类正在做一些教学。
据知情人士称,该团队由承包商和全职亚马逊员工组成,他们在从波士顿到哥斯达黎加,印度和罗马尼亚的前哨工作。他们签署了保密协议,禁止他们公开谈论该计划。据亚马逊布加勒斯特办事处的两名工作人员说,他们每天工作9小时,每位评论员每班解析多达1,000个音频片段,该办公室占据了罗马尼亚首都崛起的Globalworth大楼的前三层楼。 Pipera区。现代化的设施在摇摇欲坠的基础设施中脱颖而出,并没有外部标志广告亚马逊的存在。
这项工作大多是平凡的。波士顿的一名工作人员表示,他为特定话语(如“泰勒斯威夫特”)挖掘了累积的语音数据,并对其进行了注释,以表明搜索者意味着音乐艺术家。偶尔,听众会收听回声所有者可能宁愿保持私密性的事情:一个女人唱得很厉害比如说,或者是一个孩子在寻求帮助时,他们可以使用内部聊天室来分享文件,当他们需要帮助解析混乱的单词时,或者遇到一个有趣的录音。
有时他们会听到他们发现令人不安或可能是犯罪的录音。其中两名工人说他们接受了他们认为是性侵犯的行为。当这样的事情发生时,他们可能会在内部聊天室分享经验,以缓解压力。亚马逊表示,当工作人员听到令人痛苦的事情时,它已经制定了程序,但两名罗马尼亚员工表示,在要求对此类案件提供指导后,他们被告知干扰亚马逊的工作。
“我们认真对待客户个人信息的安全性和隐私性,”亚马逊发言人在一封电子邮件声明中表示,“我们只会注释极小的Alexa录音样本,以改善客户体验。例如,这些信息有助于我们培训我们的语音识别和自然语言理解系统,因此Alexa可以更好地了解您的要求,并确保服务适合每个人。
“我们有严格的技术和操作保障措施,对滥用我们的系统采取零容忍政策。员工无法直接访问可在此工作流程中识别此人或帐户的信息。所有信息都具有高度机密性,我们使用多因素身份验证来限制访问,服务加密和审核我们的控制环境以保护它。“
亚马逊在其营销和隐私政策材料中没有明确表示人们正在收听Alexa收集的一些对话的录音。“我们使用您对Alexa的请求来训练我们的语音识别和自然语言理解系统,”该公司在一系列常见问题中说道。
在Alexa的隐私设置中,该公司为用户提供了禁止使用其录音来开发新功能的选项。Bloomberg审查的屏幕截图显示,发送给Alexa审核员的记录不提供用户的全名和地址,但与帐号,用户的名字和设备的序列号相关联。
Intercept今年早些时候报道称,亚马逊拥有的Ring的员工手动识别公司门铃摄像头拍摄的视频中的车辆和人员,努力更好地训练软件自己完成这项工作。
密歇根大学(University of Michigan)教授弗洛里安绍布(Florian Schaub)研究过与智能扬声器有关的隐私问题,他说:“你不一定会想到另一个人会听你在告诉你的智能发言人你家的亲密关系。”我认为我们已经习惯于[假设]这些机器正在进行魔术机器学习。但事实是仍然涉及手动处理。“
“这是否属于隐私问题取决于亚马逊和其他公司对他们手动注释的信息类型的谨慎程度,以及他们如何向某人提供这些信息,”他补充道。
当Echo于2014年首次亮相时,亚马逊的圆柱形智能扬声器迅速普及家庭中语音软件的使用。不久之后,Alphabet Inc.推出了自己的版本,名为Google Home,其次是Apple Inc.的HomePod。各公司也在中国销售自己的设备。据研究人员Canalys称,去年全球消费者购买了7800万智能扬声器。还有数百万人使用语音软件与智能手机上的数字助理进行互动。
Alexa软件旨在持续记录音频片段,聆听唤醒词。默认情况下,这是“Alexa”,但人们可以将其更改为“Echo”或“计算机”。当检测到唤醒字时,Echo顶部的光环变为蓝色,表示设备正在录制并发出命令亚马逊服务器
大多数现代语音识别系统依赖于人脑上的图案神经网络。软件通过在大量数据中发现模式来了解情况。为Echo和其他智能扬声器供电的算法使用概率模型进行有根据的猜测。如果有人问Alexa附近是否有希腊地方,算法知道用户可能正在寻找餐馆,而不是教堂或社区中心。
但有时Alexa会弄错 - 尤其是在使用新的俚语,区域口语或英语以外的语言时。在法语中,avec sa,“与他在一起”或“与她在一起”,可能会让软件误以为有人正在使用Alexa唤醒词。Hecho,西班牙语的事实或行为,有时被误解为Echo。等等。这就是为什么亚马逊招募人类助手来填补算法错过的空白。
Apple的Siri也有人类助手,他们负责评估数字助理对请求的解释是否与该人所说的相符。根据Apple安全白皮书,他们审查的录音缺少个人身份信息,并存储六个月与随机标识符相关联。之后,数据被剥离其随机识别信息,但可以存储更长时间以改善Siri的语音识别。
该公司表示,在谷歌,一些员工可以从其助手访问一些音频片段,以帮助培训和改进产品,但它与任何个人身份信息无关,音频也会失真。
亚马逊最近在布加勒斯特寻找Alexa数据服务质量保证经理的职位描述了人类扮演的角色:“每天她[Alexa]听取成千上万的人与她谈论不同的主题和不同的语言,她需要我们的帮助理解这一切。“希望广告继续:”这是大型数据处理,就像你从未见过它一样。我们每天都在制作,标记,策划和分析大量的演讲。“
据一位熟悉该计划设计的人士透露,亚马逊的语音数据审查流程始于Alexa随机抽取一小部分客户录音,并将音频文件发送给偏远的员工和承包商。
一些Alexa评论员的任务是转录用户的命令,比较录音与Alexa的自动成绩单,比如说,或者注释用户和机器之间的互动。这个人问的是什么?Alexa提供了有效的回复吗?
其他人会注意到演讲者所接受的一切,包括背景对话 - 即使是在孩子说话的时候。有时听众会听到用户讨论私人信息,如姓名或银行详细信息;在这种情况下,他们应该勾选一个表示“关键数据”的对话框。然后他们转到下一个音频文件。
根据亚马逊的网站,除非Echo检测到唤醒字或按下按钮激活,否则不会存储音频。但有时Alexa似乎开始录音而没有任何提示,音频文件以刺耳的电视或难以理解的噪音开始。无论激活是否错误,审稿人都需要对其进行转录。其中一位人士表示,当Alexa没有收到任何唤醒命令或因意外触发时,审核员每天都会录制多达100条录音。