谷歌正在开放数据科学家的工具 以帮助保护私人信息
谷歌今天宣布开放其所谓的差异化隐私库,这是一种内部工具,该公司用它来安全地从包含其用户的私人和敏感个人信息的数据集中获取洞察力。
差异隐私是数据科学的加密方法,特别是在分析方面,允许依赖软件辅助分析的人从大量数据集中获取洞察力,同时保护用户隐私。它是通过将新颖的用户数据与人工“白噪声”相结合来实现的,正如连线的安迪格林伯格所解释的那样。这样,任何分析的结果都不能用于取消屏蔽个人或允许恶意第三方将任何一个数据点追溯回可识别的来源。
例如,该技术是Apple的隐私意识机器学习方法的基石。它允许Apple从iPhone用户那里提取数据,统计上对这些数据进行匿名处理,并且仍然可以提供有用的见解,这些见解可以帮助它改进其Siri算法。
谷歌使用其称为随机可聚合隐私保护序数响应(RAPPOR)的Chrome 也是如此,这是一种差异隐私工具,用于分析和从其浏览器中获取洞察力,防止个人浏览历史等敏感信息被追踪。今年早些时候,Google还开发了一款名为TensorFlow Privacy的 TensorFlow AI培训平台,该平台可让研究人员在培训AI算法时使用差异隐私来保护用户数据。
但谷歌指出,还有许多其他领域,如医疗保健和社会学,差异隐私可能是有用的。“这种类型的分析可以以多种方式和多种不同的用途来实现,写道:”米格尔·格瓦拉,在该公司的隐私和数据保护办公室谷歌产品经理,在博客文章。“例如,如果您是一名健康研究员,您可能需要比较患者在不同医院入院的平均时间,以确定是否存在护理差异。差别隐私是一种高度保证的分析手段,可确保以隐私保护的方式解决此类用例。“
在与The V erge 的另一次访谈中,格瓦拉表示谷歌为自己的内部工具开发差异隐私数据分析方法的过程是漫长,困难和资源密集的,远远超过公司最初的想法。这就是为什么谷歌希望通过在GitHub上开源图书馆,它可以帮助没有大型硅谷科技公司资源的组织和个人采用同样严格的隐私方法进行数据分析。
格瓦拉写道:“我们使用差异化私有方法在我们的产品中创建有用的功能,例如一天中的业务繁忙程度,特定餐厅菜肴在Google地图中的受欢迎程度,以及改进Google Fi。” “从医学,政府到商业,以及更远,我们希望这些开源工具能够帮助我们创造有益于每个人的见解。”