微软的人工智能人力资源数据库已被取消
微软已经悄悄地将其面部识别数据库从1000万人的面孔中脱离出1000万张图像。MS Celeb于2016年出版,其中包含从互联网上收集的用于训练识别算法的面部图像。这些图像是从搜索引擎中收集的,并且基于它们使用Creative Commons许可证上传。
“知识库提供的丰富信息有助于消除歧义并提高识别准确度,并有助于各种实际应用,如图像字幕和新闻视频分析,”当时微软表示。
根据随附的研究报告,该数据库原本应该只包括名人的图像,但根据研究员Adam Harvey的Megapixels项目,“名人”一词被广泛使用。
“目标列表中的许多人甚至对微软正在使用他们的名称和生物识别信息构建的技术进行批评。”“虽然这个数据集中的大多数人都是美国和英国演员,但”名人“一词的剥削性使用远远超出好莱坞,”哈维说。“MS Celeb人脸识别数据集中的许多名字只是那些必须为其职业生涯保持在线存在的人:记者,艺术家,音乐家,活动家,政策制定者,作家和学者。
除了开发面部识别算法外,该数据库还有其他应用程序。据“金融时报”报道,军事研究人员利用大型数据集,中国人工智能和面部识别公司SenseTime和Megvii也是如此。
据报道,该数据库还与中国的创业公司建立了联系,这些创业公司建立人工智能算法来描绘和追踪主要由穆斯林组成的少数民族。
自成立以来,中国普遍存在的监控摄像机网络受到严密审查,其社会信用体系也受到了严格审查,但发现维吾尔人的剖析和跟踪是该国的第一次。
虽然它已经脱机,但网络上仍然存在数据库的痕迹,并且可以在GitHub上免费下载,还有许多其他数据库,其中包含数百万张图像。
面部识别行业引起争议,该技术经常被证明是不准确的 - 在某些情况下显示出种族和性别偏见。其他值得注意的案例包括NYPD对该技术的笨拙使用,使用名人相似的方式在其数据库中搜索真正的罪犯。
最近几个月,使用公开的图像来填充数据库也引起了轰动。值得注意的是,IBM使用的数据库包含从图像托管站点Flickr收集的一百万张面孔,这引起了隐私问题。