Google持续投入差分隐私(Differential Privacy)技术的发展,并针对JVM平台开源发布PipelineDP4j,使Java开发者可方便地采用隐私保护技术。该工具可在大规模数据分析中保护用户隐私,确保数据运算过程个人数据不会泄露。
差分隐私是一种先进的数据保护方法,借由随机扰动和数据模糊化,确保进行数据分析时,个人资讯不会被还原识别出来。差分隐私另一项优点是与其他隐私保护技术相比,更能保留数据的统计特性和可用性。Google从2019年起陆续开源Python、Go和C++等程序语言相关工具,方便研究人员和开发者更简单地应用差分隐私技术。
有鉴于Java平台的普及,Google发布JVM的PipelineDP版本PipelineDP4j,降低Java开发者采用差分隐私的门槛,更进一步推动隐私保护技术的普及。PipelineDP4j由Google与OpenMined开源组织共同合作开发,专门针对JVM环境设计,具备高度平行化计算能力,供开发者使用Java对大型数据集进行高效差分隐私运算。
Google早已在其产品广泛应用差分隐私技术,像是使用差分隐私技术训练Gboard语言模型,在联合学习的同时也能确保修户个人数据的匿名和安全性。Google也扩展数据仓库BigQuery支持差分隐私技术,协助企业在进行分析时能够符合法遵要求。
Google也披露其最新的隐私差分技术成果,能够针对小数据集进行分析。Google Trends已经能提供低流量地区精确的趋势分析。由于差分隐私数据集必须达到最低阈值,才能避免泄露个人数据,过去小城市和特定语言群体的数据分析较为受限,但是借由Google的新技术,即使是小城市和特定语言群体的数据,也能被准确分析,同时确保修户的个人数据不受影响。