AWS更新其安全部据共享服务Clean Rooms,除了添加机器学习支持,协助用户在不共享原始数据的情况下应用机器学习模型,同时也加入了差分隐私(Differential Privacy)功能,在协作聚合数据分析结果时,模糊个人数据的贡献。

Clean Rooms服务可让企业和其合作伙伴安全协作数据处理,提供一种不共享原始数据就能协作和分析数据的方法,在追求效率和预测精确度的同时,也能安全地合作。Clean Rooms内置隐私控制功能,能以权限控制Clean Rooms成员所执行的查询和输出。

新功能Clean Rooms ML则允许用户使用机器学习模型生成预测性分析,同时保护敏感数据。而这项功能其中一项主要应用,是创建市场营销用途的相似用户群组,像是航空公司可以和线上预订服务合作,针对类似特征的用户进行营销活动;汽车贷款和汽车保险公司也可以识别,与现有租赁车主类似特征的潜在汽车保险客户。这项功能同样也能用于加速研究机构和医院的临床研究,找到与现有临床试验者相似的候选人。

Clean Rooms ML会于每一次组织数据共享合作中,训练一个由AWS管理的模型,协助用户快速生成相似数据集,省去用户自行创建、训练和部署模型的时间。Clean Rooms ML还提供了许多灵活的控制功能,使用户和其合作伙伴,可以调整机器学习模型预测结果。

AWS Clean Rooms现在也提供差分隐私功能,系统会在用户的查询结果,添加经过仔细校准的误差,也就是噪声,让查询结果足够准确,在提供有意义的分析结果的同时,也屏蔽来自特定个人的数据贡献。差分隐私功能包括了一个隐私预算组件,通过将隐私作为每次执行查询时消耗的有限资源,控制用户数据集执行的查询数量,确保噪声不能被平均,确保不会泄漏任何个人数据。当隐私预算耗尽时,在预算增加或是刷新之前,都无法于数据集中执行更多的查询。

差分隐私是一项增强数据共享时隐私保护的技术,能够分享描述数据库中部分统计特征,又不公开特定个人资讯,不过缺点就是有其实例门槛,而Clean Rooms差分隐私功能,让应用该技术变得更容易,用户只需要对数据表激活差分隐私功能,并在协作中配置差分隐私政策,就能简单地应用该技术。