Google发布Data Commons平台全新Python函数库正式版,并同步升级数据查询界面至V2 REST API。新版本函数库在功能性、弹性与集成性上较前代提升,供数据科学家、开发人员与分析师能更有效率地查询、比对并运用庞大的公开统计数据集,加速数据驱动项目开发与决策流程。
Data Commons由Google主导,是开放且持续扩展的知识图谱平台,汇集整理来自全球各地的公开统计数据。平台目前涵盖超过20万项统计变量,数据范畴涵盖人口、经济、教育、能源、环境、健康、住宅等。这些数据源多样,包括国际组织、各国政府机构、研究单位与非营利组织。
Google本次推出的V2 Python函数库,不仅回应技术社交媒体对更高效数据处理能力的要求,更集成了Pandas Dataframe模块,使查询结果能直接以开发者熟悉的数据框架操作。开发者安装单一组件后,便可在同一程序流程中进行数据截取、转换、分析与可视化,大幅简化跨平台应用与工具链集成技术门槛。函数库同时支持多种数据回应格式,包括JSON、Python字典与清单,方便集成各类分析及人工智能模型训练环境。
V2版本强调类型安全与验证,内置Pydantic验证框架,强化数据串行化与结构一致性,也进一步提升API密钥管理等状态操作的弹性。新函数库也针对常见查询场景设计多种方便的方法,像是指定统计变量后即可一键截取全球或局部数据,查询特定指标随时间的变动趋势,以及数据实体之间的映射,适合跨数据集比对或数据串联应用。
官方建议原本已使用V1 API的现有用户尽快升级,V1版本之后将进入淘汰流程,不再支持新功能或安全性更新。
此次升级也特别强化自订Data Commons实例的能力,各组织如联合国、ONE Campaign等,能在自有基础设施上架设专属的Data Commons节点,并无缝集成组织内专有数据以及全球公开知识图谱,且同时保有数据自主权与访问管控。新函数库支持对公有或私有实例的程序化查询,适用于混合云、地端部署或多方数据交换需求。