谷歌在近 30 亿台设备上扩展差异化隐私技术

在本期 Help Net Security 访谈中,谷歌隐私安全产品经理 Miguel Guevara 讨论了在大型系统中推广差异化隐私技术的复杂性。他强调了开发安全、隐私和用户控制产品的必要性,同时有效解决了将此类技术集成到现有系统中的复杂性。

格瓦拉还概述了优化这些技术的严格过程,以确保在不牺牲功能的情况下保护用户数据。

differential privacy

谷歌最近在近 30 亿台设备上实现了已知最大的差异化隐私应用。您能否详细说明将差异化隐私技术扩展到大规模所面临的挑战,以及谷歌是如何解决计算成本和可扩展性等问题的?

作为开发人员,我们有责任帮助用户保证上网安全并保护他们的数据。首先,我们要构建默认安全、设计私密并由用户控制的产品。我们在 Google 所做的一切都基于这些原则,我们很自豪能够成为开发、部署和推广新的隐私保护技术 (PET) 的行业领导者,这些技术能够在保护用户隐私的同时,提供有价值的见解并创造有益的体验。

差异化隐私保护是我们在过去十年中投资的关键 PET 之一。我们为最近取得的这一成就感到自豪,但一路走来也并非没有挑战。构建基础架构的主要障碍之一是以高效和可扩展的方式进行。我们对所实施的架构进行了多次尝试,直到找到了一个足够高效的架构。在部署 PET 的过程中,很多时候我们都是在开辟新天地,没有任何现有技术可以指导这种即时开发。

这就是为什么迭代是关键所在,同时还要对我们的架构进行测试,以找到最佳解决方案。我们进行了大量测试,以确保基础架构能够处理来自近 30 亿台设备的海量数据。设备上的差异隐私增加了一些挑战。为了保护差异隐私,我们需要创建合成观察结果。这会增加设备上的处理量,导致电池和内存使用量增加。因此,我们需要确保优化整个设备群的资源,并能够接收因合成观测而增加的数据负载。

众所周知,差异化隐私因其技术复杂性而难以整合。谷歌在谷歌 Home 和谷歌搜索等产品中整合差异化隐私时面临哪些主要技术障碍,又是如何克服的?

差异化隐私有多种设置:本地模式、中心模式和洗牌模式。每种模式都有不同的复杂性。将差异化隐私与谷歌搜索中的 “趋势 ”整合在一起具有挑战性,因为我们需要在现有系统中构建差异化隐私,而我们能为系统引入的变化程度受到限制。因此,我们的研究团队花了一些时间与 Trends 团队合作,才提出了一个非常适合的算法。

此外,在添加基于差异化隐私的新功能时,我们需要找到差异化隐私能为用户带来净收益的机会空间。通过 Google Trends,我们找到了其中的一个机会,实现了以前不可能实现的新用例。我们的团队了解到,许多本地记者在搜索不符合先前阈值的相当小众的结果时,很难在 Trends 中找到见解。在与 Trends 团队讨论后,我们提出了一种依赖于差异化隐私的解决方案,可以解锁这些新的使用案例。这是一种自然的双赢,实施差异化隐私为新用户群释放价值,而这正是我们部署 PET 的最终目标。

谷歌利用差异化隐私提高了谷歌 Home 中 Matter 兼容设备的可靠性。您能解释一下差异化隐私洞察如何帮助改善这些设备的连接性和用户体验吗?

在 Google Home 的示例中,我们使用了我们为洗牌差异隐私构建的基础架构。这种基础架构非常灵活,在收集数据时可以执行本地、中央和洗牌式差分隐私,以及其他隐私保护机制。Home 团队面临的一个挑战是如何识别一些与 Matter 相关的崩溃。他们依靠我们的洗牌基础架构来深入了解这些设备。

依靠这一基础架构,Home 团队能够识别出试图使用 Google Home 进行连接但失败的 Matter 设备。这种对崩溃设备及其崩溃方式的洞察力使他们能够隔离问题,并迅速发布修复程序。这是我们喜欢为 PET 工作揭示的幕后秘密的一部分。

谷歌在开源隐私增强技术(如完全同态加密(FHE)和联合学习)方面取得了长足进步。谷歌如何看待这些资源对网络安全社区的影响,尤其是对处理敏感数据的开发人员的影响?

我们知道其中一些技术的门槛很高。我们的主要动机是降低开发人员尝试这些技术的成本。FHE 也是一个特殊的案例,因为该社区刚刚起步。我们希望通过 FHE 为社区提供工具,帮助加快 FHE 的开发,并展示其在一系列应用中的实用性。

我们还希望,通过展示我们使用这些技术的各种实例,可以鼓励其他人尝试在类似的问题类别中实施这些技术。我们的长期目标是创造一个良性循环,即我们对 PET 的一些实施激励其他人在新领域实施 PET,而这反过来又为我们在某些功能中使用 PET 提供了新思路。正如我们过去所指出的,水涨船高–这对于更广泛地部署 PET,使互联网成为一个对所有人都更安全的地方来说尤其如此。

随着 PipelineDP4j 的发布,Java 开发人员现在可以访问差分隐私了。发布这一 Java 虚拟机 (JVM) 背后的主要动机是什么?

我们开源差分隐私库的历史由来已久。多年来,我们的目标一直是使我们的算法透明化,以便独立研究人员可以检查它们,并降低试图使用差分隐私(和其他隐私技术)的人的进入门槛。免费提供这些算法是我们在全球范围内推广应用的承诺,这也是我们致力于用尽可能多的开发者语言发布我们的库的原因。

几年前,我们与 OpenMined 合作开源了 PipelineDP。PipelineDP 基于 Python。我们知道,许多开发人员的工作流程使用 Java,因此我们希望为这些开发人员构建一个解决方案。我们希望更多的开发人员能够构建具有差异化隐私的应用程序,并对即将出现的所有新用例感到兴奋,尤其是随着技术的不断发展。

免责声明:文章内容不代表本站立场,本站不对其内容的真实性、完整性、准确性给予任何担保、暗示和承诺,仅供读者参考,文章版权归原作者所有。如本文内容影响到您的合法权益(内容、图片等),请及时联系本站,我们会及时删除处理。查看原文

为您推荐