Google DeepMind新开发的AI新系统“AlphaEvolve”,是一套使用大型语言模型自主发现并系统性地改善算法的AI代理,使它更符合实际需求。

AlphaEvolve的运行方式结合2种Gemini模型,其中Gemini Flash负责生成多样化的程序方案,而Gemini Pro则对这些方案深入分析。AlphaEvolve根据准确性、运算效率等客观指标对各种方案进行评估,选出表现最好的变体,并在循环过程不断进化。

Google DeepMind将AlphaEvolve描述成测试时运算代理(test-time compute agent),是一种在运行时主动探索和评估新方案的AI系统。AlphaEvolve使用测试时运算主动解决问题以改善结果,与目前的推理模型做法一致,然而AlphaEvolve是通过循环过程多次生成、测试及改善整个算法,整个过程更有效率,过去需要数周进行改善,现在只需几天的时间就能完成。

AlphaEvolve已在Google多个基础设施环节加以运用,例如为Google的“Borg”管理系统开发出一种新的资源分配方式,平均释放Google全球0.7%计算资源。

AlphaEvolve也帮助优化Gemini模型本身,通过改进矩阵乘法的分解决方案式,使模型训练时间缩短1%。在另一案例中,AlphaEvolve改善FlashAttention核心,这是运行大型语言模型的关键GPU组件,达到最高32.5%的性能提升。

AlphaEvolve成功提高Google在数据中心、芯片设计及AI训练流程的效率,甚至包括训练AlphaEvolve自身所采用的大型语言模型。它有助于设计更快的矩阵乘法算法,为尚未解决的数学问题找出解决方法,凸显应用在不同领域的可能性。

(图片来源:Google DeepMind)