Google刚整合完成的AI部门DeepMind主管透露,公司正运用AI模型AlphaGo的经验,开发下一代AI聊天机器人,成果会比OpenAI的ChatGPT更强大。

DeepMind共同创办人暨首席执行官Demis Hassabis日前接受《Wired》访谈时表示,该公司正在开发的最新大型语言模型(LLM)名为Gemini。DeepMind在5月间Google I/O首次介绍Gemini,Gemini本质上和ChatGPT底层的GPT-4类似,都能处理文本输入并生成自然语言的回复,但是Gemini更具备规划或解决问题的能力,这是来自DeepMind的AlphaGo模型,而依赖的是AlphGo的增强式学习(reinforcement learning)训练方法。

AlphaGo正是2016年击败韩国围棋棋王Lee Sedol,2017年再败世界棋王柯洁的棋艺AI模型。DeepMind后来又再推出了更强大的棋艺AI系统AlphaGo Zero及AlphaZero。

所谓增强式学习是计算机模型通过与动态的环境反复互动,通过尝试错误(trial-and-error)及回应/处罚(reward/punishment)的方法,逐渐学习正确执行一项任务的方法。这能使模型在没有人类干预、没有被写入明确执行任务的程序下做出一系列决策。AlphaGo也是增强式学习的经典范例,AI模型逐渐学习到下围棋或打电玩下一步该选择什么样的行动。

Hassabis说增强式学习之外,AlphaGo还曾用到竞赛树搜索(tree search)以探索、记忆棋盘上可能步数等其他技巧。

Hassabis形容,Gemini更像是增加自然语言能力的AlphaGo模型,他相信使用AlphaGo的技术研发的Gemini大型语言模型,将会比ChatGPT更强大。

Gemini还开发中,DeepMind表示,还要好一阵子才会完成,而且也将耗费数千到数亿美元的费用。《The Wired》引述OpenAI首席执行官Sam Altman指出,GPT-4的开发成本超过1亿美元。

DeepMind去年9月宣布更安全的聊天机器人Sparrow的开发计划。DeepMind曾说今年会推出Sparrow的测试版,但Sparrow是否持续开发,或会集成到Gemini中则不得而知。

Gemini将是Google能否重夺AI领导者角色的关键。为了追赶微软及OpenAI,Google除了开发AI聊天机器人Bard,也整合Google Brain及DeepMind,并投入一组人开发加速搜索的AI项目。

此外6月初DeepMind另外用AlphaZero为主轴,公布AlphaDev模型,旨在提升数据库检索速度,借此节能、节省大型数据中心成本。