Google云计算加入一个称为Tecton的功能平台,可自动执行生产环境中,构建和管理机器学习特征的步骤,Tecton是一个全托管特征构建和调度服务,可完整管理机器学习特征生命周期,降低组织构建、管理和共享机器学习特征的障碍,并提高模型性能和可靠性,控制机器学习应用程序的开发和维护成本。

目前不少企业开始将机器学习功能集成进应用程序中,但是机器学习模型需要高品质的数据,经过转换创建机器学习特征,才能做出精准预测,而Google提到,构建和管理生产环境机器学习特征数据工作管线并不容易,这些工作管线的数据来自批处理或是流媒体传输等不同来源,在将这些数据转换成为机器学习特征之后,才能用于训练和服务上。

而Tecton的目标是要能自动处理机器学习特征的构建、处理、共享和供给工作,数据团队可以使用Tecton的声明式框架,将特征定义为程序代码,在底层会由Tecton调度转换与实现机器学习特征所需要的实际工作管线。通过Google Cloud Build这类CI/CD工具,开发者可以将Tecton特征当作程序代码进行管理,集中管理程序代码方便共享和协作,就像是管理基础设施即程序代码,或是模型即程序代码一样。

Tecton可自动连接和维护Google云计算批处理和流媒体服务的新数据,同时Tecton也支持来自包括Redshift、Snowflake和Apache Kafka等非GCP的数据。Tecton在Google云计算上,会使用Databricks或Dataproc分布式运算平台聚合和转换数据,将传入的数据转换成为特征,放到线上与脱机特征商店中。数据特征存放在Tecton低延迟线上存储,服务即时供给需求,同时也会存放在脱机存储,以用于产生训练数据集和脱机推理用途。