谷歌开放源代码的工具,为公司的目的是保持个人数据的隐

市场2020-09-06 22:40:32
导读作为一家追踪用户在线活动的公司,谷歌肯定会不遗余力地证明自己对隐私的重视。为此,这家互联网巨头正在开放一个

作为一家追踪用户在线活动的公司,谷歌肯定会不遗余力地证明自己对隐私的重视。

为此,这家互联网巨头正在开放一个图书馆的资源,以保护隐私的方式从聚合数据中收集信息。


该库被称为差异私有SQL,它利用了差异隐私(DP)的思想——一种统计技术,使收集和共享用户的聚合信息成为可能,同时保护个人隐私。

这允许开发人员和组织构建能够从聚合用户数据中学习的工具,而不需要暴露任何个人身份信息。

如果公司希望在不受去匿名化(或重新识别)攻击的情况下与其他公司共享机密数据集,这种方法可能特别有用。

米格尔·格瓦拉说:“如果你是一名健康研究员,你可能想要比较不同医院的病人平均住院时间,以确定在护理方面是否存在差异。”“差异隐私是一种高度可靠的分析方法,可以确保以保护隐私的方式处理此类用例。”

对于那些没有经验的人来说,DP的工作方式是在个人信息上传到云端之前,策略性地向其添加随机噪声。因此,整个数据集仍然可以显示有意义的结果——虽然不精确——足够准确,而不会泄露个人的敏感数据。

谷歌的开源本质上是一个允许组织在数据库上执行不同的私有聚合的过程。除了允许多个记录与单个用户关联外,“开发人员还可以使用我们的库计算计数、总和、平均值、中位数和百分位数,”这家搜索巨头说。

DP的目标不是数据最小化:它不会阻止公司窃取你的个人数据。而是在通过数据挖掘技术推断模式时不要泄露这些信息。

谷歌最早的差异化隐私举措之一是RAPPOR,这是一种从chrome.com等应用中匿名众包统计数据的方法,有“强大的隐私保障”。

从那时起,该公司就使用这种方法来保护所有不同类型的信息,从谷歌Fi移动客户的位置数据到帮助识别谷歌地图上的餐馆菜肴受欢迎程度的设计功能。

谷歌甚至计划利用DP作为其网络反跟踪政策的新提议的一部分,这一举动招致了隐私倡导者的强烈批评。

但这家搜索巨头绝不是唯一的玩家。差异化的隐私保护巩固了苹果机器学习算法的整体,它使用这些算法来统计匿名化iPhone用户数据,并得出有用的结果。

但2017年的一项研究发现,其方法存在缺陷,尤其是在隐私预算(或隐私损失参数)方面——这决定了准确性和隐私之间的权衡。

与此类似,优步也有自己的DP版本,叫做FLEX,用来限制查询对任何优步乘客或司机透露太多信息。

推出一个DP方案并不简单的部分原因是,它要求该机制能够万无一失地确保数据在发布后不会受到各种意外后果的影响,包括数据泄露。

通过开源,Googlenot只是想通过来自学术界和普通技术社区的广泛反馈来改进它的产品。它进一步希望该工具将被其他开发人员所接受,而不需要设计定制的DP解决方案。

不同隐私的数据分析也加入了该公司一系列以隐私为重点的开源项目——联邦学习、TensorFlow隐私、私有连接和计算、私有集合交集和机密计算——所有这些都是为了在不同级别的互联网机制上提高隐私和安全。

格瓦拉说:“从医学到政府,再到商业,以及其他领域,我们希望这些开源工具将有助于产生有益于所有人的见解。”

随着硅谷科技巨头因一系列隐私方面的失误而日益受到监管机构的关注,谷歌正在进行的努力可能会被视为一种尝试,目的是证明其利润丰厚的定向广告业务的数据收集是正当的。

最终,关于差别隐私的好处还没有定论。但即使它有助于解决一些困扰当今大型科技公司的数据安全和保护问题,也是值得的。


免责声明:本文由用户上传,如有侵权请联系删除!