“GAI代理(Agent)将会反转开发者、企业与运算设备和Web的互动的方式。”Google Cloud首席执行官Thomas Kurian在今年Next大会开场时这样强调,不分产业,企业纷纷利用生成式AI推动业务增长、增强用户体验,以及改善开发者生产力和提升IT运维效率,“许多行业正因为GAI而开始改变。”
过去一年,企业GAI应用的风潮席卷全球,成了三大公有云积极抢攻的新战场,微软靠着OpenAI助攻,去年在这场云计算GAI大战中取得先机,而Google后来居上,靠着自家PaLM模型和GAI生产力工具来迎战,AWS则是到去年底年会上,对于企业GAI应用布局才有比较完整的布局与披露。
Google在生成式AI布局动作频频。去年8月的Next大会成了Google生成式AI的火力展示,更是对微软Copilot战略的反击。进到2024年,Google更加快GAI产品发布和更新的脚步,积极布局新一代企业生成式AI构建需求。
在今年的Next大会上,Google Cloud首席执行官Thomas Kurian在开场时强调,今年的策略将聚焦于加速企业业务和产业数字转型,他同时也披露了在AI布局的多项成果,其中包括不到一年,已有上百家主要企业都已经开始在内部应用中采用Gemini,包括了麦当劳、德国银行、HCA健康、USS、Mayo Clinic医疗机构等,在今年大会期间,更举办超过300场企业GAI应用实例,涵盖金融业、零售业、医疗业、制造业等。
Vertex AI和各种云计算服务中开始引进新一代Gemini 1.5模型
Google在今年2月发布性能更强大、能够支持超长文本的Gemini 1.5多模态模型,更成为今年Next最受瞩目的焦点。
在Next大会,Google将这款最新版Gemini模型上架到生成式AI开发平台Vertex AI的模型花园中,Gemini 1.5模型不仅可同时支持文本、图片、视频、声音及程序代码的输入,而且在Token处理数量上也比1.0版多出了31倍,甚至比GPT-4 Turbo高出7.8倍,最多可支持输入长达100万个Token,相当于一次能处理1小时的视频、11小时的音频或超过70万字的内容。
Vertex AI先提供了中端款模型Gemini 1.5 Pro的公开预览,并推出两个不同规模的版本,分别能处理12.8万个和100万个Token数量的数据。Google强调,Gemini 1.5 Pro模型在输出品质上足以媲美前一版最高端Gemini 1.0 Ultra模型,同时能减少运算量。
Gemini 1.5 Pro还支持处理语音音频流媒体和视频的音频,并具备跨模态分析功能,能够同时分析文本、图片、视频和音频等不同类型的数据,此外,提供高品质的转录功能,可用于搜索和分析。例如,可以使用Gemini 1.5 Pro对财报电话会议或投资人会议视频或录音进行搜索、分析和回答问题。
目前已有United Wholesale Mortgage、SAP、TBS、Replit等企业开始在Vertex AI平台上使用新版模型创建新的AI应用,包含AI驱动的顾客服务代理、学术指导导师,还能用AI分析大量复杂的财务文件、检测文件中资讯不一致,以及用自然语言进行数据集的探索。
最新的Gemini 1.5 Pro,现在也能在Gemini Cloud Assist云计算助手服务中以私人预览方式提供,一次可以输入最多30万行的程序代码,意味着,可以在程序库中执行大规模程序代码检索、调试及测试,也有助于加快企业许多老旧系统的现代化改造,将大批老旧程序语言转为现代语言。Google Cloud平台与技术基础架构宏观经济理Brad Calder强调,Gemini程序开发AI助手让开发人员的工作效率因此提高30%。
在Next大会上,Google提出了5种企业上云转型的新路径,可从五种云计算服务类型开始上云,分别是基础架构云、开发者云、数据云、安全云、协作云。Google也将最新Genini模型集成到这几类云服务中,像是协助回答问题,提供AI预测等。
以基础架构云为例,Google开始在企业数据中心部署的GDC分布式边缘设备上提供各种开放AI模型,如Gemma、Llama等,并推出生成式AI搜索支持功能,让用户可以通过自然语言搜索从本地数据中心或边缘环境上快速检索和分析内部相关的数据和内容,从而提高员工工作效率和知识共享。
Google更推出了多项基础架构的技术创新,可以用来支持庞大AI发展的需求,像是正式推出新版的TPU v5p,还推出A3 Mega、Nvidia Blackwell GPU运算平台,支持大规模的GAI模型训练与推论。Google更展示首款专为数据中心设计的Arm架构处理器Axion,跟同级的x86虚拟机相比, Axion性能提高了50%,能源效率也提升60%,未来有可能将其与TPU一同用于GAI模型服务。目前这款处理器已在Spanner、BigQuery、GKE、Google地球引擎和YouTube广告服务中使用。
在云计算应用生命周期管理上,Google推出名为Gemini Cloud Assist的云计算运维助手的私人预览, 也就是先前专用于IT运维设计的Duet AI助手进化版,不只采用最新Gemini模型,能够涵盖应用程序生命周期的管理,提供包括目标设计、安全、运维指导、故障排除等多方面辅助功能。另外提供性能和成本优化的建议。
Google公布新生成式AI产品架构
Google Cloud在会中提出一个生成式AI产品架构蓝图,将生成式AI产品架构从过去生成式AI开发工具为主的开发架构,变成是扩大延伸到各种云计算服务的产品架构。
这个产品技术框架可以进一步分为4层,虽然和过去生成式AI开发平台Vertex AI都是4层架构,但两者在本质上有很大的差别。新架构最底层是AI Hypercomputer超级计算机基础架构,专门针对生成式AI强化推出的基础架构,提供AI模型训练和服务所需的各种AI加速硬件、软件框架和相关系统资源,与Vertex AI的底层是以一般性的云计算基础架构为主有所不同。
再上一层是Gemini模型。原本Gemini只是Vertex AI模型花园中的一个模型,现在被拆分出来,成为与Vertex AI开发工具并重的另外一个重要的功能。这是因为Gemini模型已经变成支持Google Cloud所有产品的重要核心基础模型。第三层是生成式AI平台Vertex AI,包含了AI Studio、Colab、VS Code等各种GAI开发工具。最上层则是Google云计算服务和办公生产力Workspace专用的Gemini助手,以及企业自建的生成式AI代理。
新产品架构下的Vertex AI平台,现在进一步加强企业GAI代理开发的支持。
例如在模型构建上,Google将Google搜索作为可信来源的参考基准,推出Grounding with Google Search新服务,利用Google搜索结果比对模型生成的内容,借此提高回应品质并减少幻觉。在模型微调方面,Vertex AI提供简化提示设计,让开发者更容易撰写出高品质的提示,并推出新提示管理工具,可用于管理、关注,比较不同提示版本的回应品质。此外,模型部署到正式环境前,开发人员也能利用新的模型评估机制AutoSxS比较两个LLM模型版本的差异对于最后模型推论的影响,以此选择最佳模型版本用于生产环境。
Google这次推出了一站式AI解决方案,称作Vertex Al Agent Builder,该方案进一步结合“搜索”和“对话”两类GAI应用组件,能快速在企业内部应用创建和部署No Code对话式生成式AI代理,且可与企业系统相连接,让生成的回复内容可以贴近企业的实际情况。
Thomas Kurian指出,企业在Vertex AI中可以快速自建GAI代理,来执行不同任务,像是有顾客服务的AI代理、员工管理的AI代理,还有创意设计、数据分析、程序撰写和安全等不同的AI代理。“每一个GAI代理都具有多模态执行能力,能够同时处理多种资讯。”
Google公开了最新的TPU模块机架式机柜(左图)和云计算GPU机柜(右图),用来提供包含Gemini在内的GAI模型训练和服务。每台TPU模块机柜最多可容纳64个TPUv5p模块。
云计算AI运维助手不只提供云成本优化的建议,还支持目标驱动设计
Google今年云计算产品发布中另一个重要焦点,着重在加强其云计算服务GAI集成能力,与去年刚推出时相比,现在在Google云计算服务中不仅可以使用GAI助手完成更多任务,进一步也将其扩大到更多的服务中。
Google今年开始以生成式AI助手Gemini为品牌,应用在各种云计算服务中,推出软件开发AI助手、应用生命周期平台的AI运维助手、数据分析平台的AI分析助手,BI平台的AI洞察助手,数据库的A管理助手,以及安全的AI防护助手。
AI运维助手的最大特色是,引进最新Gemini模型,涵盖应用程序生命周期的运维管理。
例如,AI运维助手现在能支持目标驱动设计的功能,让运维人员可以用自然语言描述创建待测试的目标和用户旅程流程,进而产生自订的测试脚本,根据需求进一步提供架构配置、部署或设置,例如提供网络配置或协助三层架构应用程序部署、理解Terraform脚本等。
此外,还能搜集和分析Cloud Logging中各种日志,提供IT团队相关摘要和解释,并提供故障排除的建议。甚至在身份权限管控上也能使用AI运维助手提供IAM身份识别与访问管理的建议,例如根据企业数据、加密偏好以及合规性需求在加密密钥创建过程中提供协助。
服务性能和成本优化也是AI运维助手这次添加的功能之一。例如可以侦测哪些集群是在开发或测试环境中执行,或是被用于实验的集群,还可识别资源过剩的集群并提供建议,让管理者可以重新调整资源分配,降低云计算花费。
在数据服务的AI助手上,Google Cloud持续强化旗下数据产品与Gemini的集成。举例来说,现在在BigQuery数据仓库中,数据分析人员可以自然语言方式向Gemini助手提需求进行数据准备、查找、分析及治理,并且能够使用Gemini 1.0 Pro,执行多模态和高端推理的功能。
不仅如此,BigQuery与Vertex AI之间的结合更紧密,用户可以直接在BigQuery中访问Vertex AI中的AI型,代表企业可以将这些AI模型、ML operators和统计分析功能纳入到企业内部数据工作流程中,进行多模态析,包括结构化与非结构化数据。在BigQuery中能通过Vertex AI模型API处理文件文件和音频。不过目前这些Gemini功能大多处于预览阶段。
在应用开发辅助方面,Google宣布其程序撰写AI助手现已达企业级的安全和可靠,并支持最新的Gemini 1.5 Pro,可以在程序库中执行大规模程序代码检索、调试及测试。在云计算安全防护方面也强化了与Gemini的集成。例如,将Gemini集成至SecOps运维流程中,并开始在威胁智能情报服务与SCC安全指挥中心中提供相关的Gemini服务。
除了推出算力更强的AI硬件,Google首款数据中心设计的Arm架构处理器Axion首次公开亮相,未来有可能将其与TPU一同用于GAI模型服务。目前这款处理器已在Spanner、BigQuery、GKE、Google地球引擎和YouTube广告服务中使用。
企业办公生产力工具深度集成Gemini能力,还增添视频创作AI助手Vids
企业生产力应用是另一大云计算GAI战场。为了力抗微软M365,Google Workspace在今年二月开始引进Gemini模型,加强对Workspace内容的多模态高端理解能力,Google同时也将Workspace的AI助手Duet AI改名为Gemini,并推出商用版与企业版,提供更多企业级功能。
Workspace目前拥有超过30亿用户和超过1,000万付费订阅客户。Google Workspace的副总裁兼宏观经济理Aparna Pappu表示,在近8个月内,在Workspace中使用Gemini服务的用户超过一百万人,还有上千家企业采用,包括Uber、Verizon、Sports Basement等。
Workspace今年产品更新一大重点就是GAI。Gemini现在已经能够跨Workspace产品线生成内容,Chat和Docs中都开始使用最新的Gemin模型。
在Gmail中添加语音提示和即时润色,只需向Gemin说出“帮助我写作”,就能完成草稿,并且一键转换为完整的电子邮件。Meet上添加了AI会议和通讯的扩展功能,每位用户每月10美元,可以提供“为我做笔记”、“为我翻译”等功能。还可以自动检测和翻译Meet中的字幕,最多支持69种语言,并在预览版Chat中自动翻译消息、对话摘要和问题回答,将于今年稍后推出。
Google也通过AI加强Workspace的安全防护,推出AI Security商用附加服务,能够协助安全人员自动分类Google硬盘中的敏感文件并提供防护。此外在测试版Gmail中开始提供DLP数据外泄防护的控制和分类标签功能,甚至之后将实验后量子加密PQC算法纳入其中。
Workspace这次还推出了全新的AI视频创作生产力服务Google Vids。这是一个集成视频、写作、制作和编辑的AI助手,让即使是不熟悉视频创作的营销人员也能快速制作出各种视频内容,用于产品营销、人才培训、团体庆祝等活动。 Vids虽然采用了Gemini模型,但与OpenAI的短片生成AI模型Sora不同,并非生成完整的视频内容,而是根据用户的描述从视频数据库中找出相应的视频、图片和背景音乐的场景,然后将它们集成在一起,协助用户完成分镜脚本、后期和编辑。这项实验性服务预计在6月推出。
随着GAI应用在2024年大爆发,Thomas Kurian强调,企业正在迎来一个GAI代理的新时代,并且创建在全新、完全开放的AI平台之上,“我们正在重塑云计算基础架构,以应对该趋势。”
不只抢攻云计算GAI,Google正在通过在手机上执行的轻量Gemini模型,以及用相同技术所开发的开源边缘AI模型Gemma,瞄准企业边缘GAI应用需求。