改用GAI辅助上亿笔数据处理,媲美100倍人力的生产力!商品SKU 4亿笔,年营收20兆元的全球零售龙头Walmart,在仓储管理、订单履行、搜索功能、商品推荐、店员服务优化,以及打造各式各样运营和购物体验时,都以这傲人规模的商品数据集作为基础。不过,梳理几亿笔商品数据的艰巨工程,谁来做?

若是以前问这个问题,举起手的是无数个数据团队成员,必须日以继夜的更新和完善商品数据,这些数据才能成为后续高端应用的养分。不过,现在Walmart有了一个新法宝,让举起手的人变少了。这个法宝正是近年爆红的生成式AI技术。

Walmart资深副总裁Stephanie Wissink在今年8月说明会披露了不少生成式AI的成果,也透露未来要开始将GAI运用到供应商管理,像是第三方供应商的客服,意见汇集整理等。尤其有一项关键作业的成效惊人,引起各界高度关注,这是目前少数对外公开,跨国企业导入生成式AI的成效实例。

他们用生成式AI来创建及完善商品目录数据,支持至少8.5亿笔数据的处理作业。“没有生成式AI,在相同时内完成同样作业,需要近100倍人力。”Stephanie Wissink说,“提升了商品目录数据品质,几乎对于我们所有业务都有正面影响。”这是一项影响遍及Walmart所有业务和运营的关键作业,生成式AI创造了媲美100倍人手的生产力。

参与过统一集团数据与AI发展的高雄科技大学营销与流通管理系副教授欧宗殷观察,Walmart生成式AI应用已经发展到相当后期的阶段,且兼具深度与广度。

欧宗殷指出,零售业生成式AI发展有5个阶段,从加速开发、分析消费记录及产品资讯等数据、构建企业综合知识库及知识管理工具、设计和影音等内容创作,最后一个阶段是顾客服务、营销与推荐。Walmart生成式AI应用已经波及这5个阶段,可以带来四大类的价值,提高生成内容精准度、带来实质效益、业务模式创新,和体验优化。

除了一开始提到的各式数据应用,Walmart优化商品数据品质还有助于门店销售商品选择、利用计算机视觉等技术标注和添加更多商品数据、分群门店特性用于经营决策参考、商品定价,甚至是更加了解顾客行为模式,并直接带来营收。

Walmart首席执行官Doug McMillon举例,完善后的商品数据,会用于电商生成式AI搜索功能,强化跨商品分类搜索的能力。这有助于他们更细致理解顾客的偏好和购买周期等行为模式。进而带来更多营收,直接强化获利能力。

这是因为,搭配生成式AI技术的搜索引擎,能通过语义分析、跨分类商品检索等能力,呈现出与消费者输入关键字本身未必直接相关,但符合消费者潜在购买意愿的其他商品。这样一来,既能提升客单价,也能进一步通过消费者购买与否,来了解更多消费者习性。

Doug McMillon将这个现象模拟做实体购物时的冲动消费。“人们走进实体店面时,常会购买不在购物清单上的东西。”这于实体零售已经自成一门学问:如何根据消费者习性,陈列看似不相关但有高机率被同时购买的东西──经典的尿布与啤酒故事。现在,电商的虚拟货架也能呈现出这些促成冲动消费的商品。甚至,可以做到实体门店更加细致,记录每一笔这类消费行为,并以个人等级颗粒度,呈现出该顾客最有可能连带购买的商品。

利用生成式AI来大幅提升数据梳理效率,不仅能节省人力成本,还连带加速后续应用开发速度,有助于Walmart面对大型企业应用生成式AI一大挑战,也就是如何持续高速创新。

Walmart大举应用生成式AI到企业内外部场景。图为他们结合AR技术与生成式AI打造而成的室内设计购物助手实验原型,根据自然语言输入来为顾客房间模拟摆设适合的商品。这些技术背后使用的商品数据,也会靠生成式AI清洗和梳理。

Walmart应用生成式AI的4大挑战

Walmart应用AI及生成式AI时,有4大挑战:持续高速创新、数据及开发规模庞大、成本控制不易,以及需要执行复杂严谨的生成式AI治理政策。其中,持续高速创新是Walmart主任数据科学家Michael Pfaffenberger最为重视的。

Michael Pfaffenberger说明,零售科技竞争非常激烈,就算Walmart在这战场中算是领先者,仍时刻不能慢下创新脚步。同时,Walmart还有一些限制,使他们接触新科技时更需要快马加鞭开发进度。

其中一个限制是,正式采用新技术的时机点较慢。就Walmart来说,财会部门需要管控和记录GenAI使用支出,且使用的服务需要具备更高服务水准,因此得等一般可用(Generally available)的商业级产品发布才会激活。创业公司或中小型企业,则没有这么重的包袱。

他举例,Azure开放使用GPT4-Turbo的时间比OpenAI开放试用版的日期晚了9天,且企业还需要等待厂商协助设置和导入,进入Walmart自家正式开发环境。这就会让Walmart于竞争激烈的环境中晚了数周才起步。“这听起来不久,但上市时间在生成式AI军备竞赛中非常重要。”他强调。

第二个挑战是数据及开发规模庞大。Walmart有近3亿名会员、4亿笔商品SKU、2百万名员工、上万家门店、月流量4亿人次电商和无数家第一方及第三方供应商,产生惊人规模的数据。不只数据量日益增加,Walmart还不断将生成式AI应用于更多、更大、更复杂的问题。这些因素,使Walmart必须在多云计算平台及多地理区域增加开发资源,并确保系统有高可用性。

规模庞大便会带来第三个挑战,开发成本控制不易。尤其是,以不牺牲功能性和性能为前提来控制成本。如何提高IT资源利用率,成为极其复杂但不得不面对的议题。例如,如何减少资源闲置时间、自动调整机器用量、有效的IT硬件及开发资源共享、采购高性能计算硬件或采用适当IT基础架构等。

第四是更强的AI治理需求,也就是如何避免生成式AI产出内容在伦理或法律上产生威胁,同时兼具应用的可用性和性能。这对Walmart来说不只是IT和数据部门的责任,更涉及了横跨法务、公关、会计等部门。

打造生成式AI“游乐场”,标准化开发环境更鼓励企业上下探索应用

Walmart原本就有一套MLOps平台Elements,可以同时管理和运行百万个模型,来支持2万5千名IT团队和数据科学团队的各种AI应用。如今,此平台也加入了生成式AI应用所需的开发资源,加入更多任务具、相关模型等,系统性应对生成式AI发展的四大挑战。

不只大幅强化技术人员的AI军火库,Walmart更针对非IT人员开发了一个名为GenAI Playground的生成式AI沙盒工具。这个“游乐场”提供各式开发工具及测试环境,也包含No-code开发工具,让非IT或数据背景的员工,也能根据自己岗位需求和灵感,自行打造和试用生成式AI功能。

除了打造全公司人人都可用的生成式AI应用开发工具之外,Walmart还有各种搜集员工关于生成式AI应用发展及使用反馈的机制。例如,他们会定期开研讨会,将业务人员和工程师齐聚一堂,由第一线业务人员提出需求和想法,并由工程师说明技术细节,借此寻找新应用可能。他们也会搜集员工使用生成式AI工具的数据来分析使用情况,并于这些工具中提供用户反馈功能,鼓励员工主动回应使用心得。

借由这些工具,Walmart已经开发出许多大规模生成式AI应用,囊扩对内和对外业务。这包括基础数据梳理、生成式AI搜索功能、电商购物助手机器人、总部员工生产力工具、门店运营辅助、员工学习及福利管理工具、语音客服与购物等。未来,还将进一步应用生成式AI于AR家具及服饰购物功能,以及第三方供应商的客服功能。