前OpenAI首席技术官穆拉蒂(Mira Murati)所创立的Thinking Machines Lab,外界对其挖角OpenAI研究团队组新班底,以及如何利用20亿美元新资金进行研究、开发产品充满好奇。

Thinking Machines Lab近日发布博客文章,穆拉蒂的研究团队首次公开其中一项项目内容:打造能重现回应的AI模型。

这篇标题名为《克服LLM推理中的非确定性》(Defeating Nondeterminism in LLM Inference)的文章,试图厘清导致AI模型回应出现随机性的根本原因。比方说,向ChatGPT重复提问一个问题多次,很可能得到截然不同的答案。如今AI业界普遍接受现有AI模型被视为非确定性系统,然而Thinking Machines Lab认为这是可以解决的问题。

文章作者、Thinking Machines Lab研究员Horace He主张,AI模型随机性根本原因,来自推理处理过程将GPU核心(即在NVIDIA芯片内部运行的小程序)拼接运行的方式。他认为,通过仔细控制这层编排,就有可能让AI模型变得更具确定性。

除为企业与科学家打造更可靠的回应以外,Horace He也提到,让AI模型生成可重现的回应,还能改善强化学习(Reinforcement Learning,RL)的训练过程。强化学习是通过对正确回答进行奖励来教导AI,但若每次回应略有差异,训练数据就会受到噪声影响。让AI回应更为一致,可使整个强化学习流程更顺畅。值得一提的是,根据外媒The Information先前报道,Thinking Machines Lab向投资人表示,计划利用强化学习为企业量身打造AI模型。

Apologies that I haven't written anything since joining Thinking Machines but I hope this blog post on a topic very near and dear to my heart (reproducible floating point numerics in LLM inference) will make up for it!
— Horace He (@cHHillee) September 10, 2025

在硅谷创投Andreessen Horowitz(a16z)领投下,Thinking Machines Lab募得20亿美元资金,这轮还有NVIDIA、Accel、ServiceNow、思科、AMD、Jane Street参与投资,使公司估值来到120亿美元。

穆拉蒂在7月曾表示,Thinking Machines Lab首款产品将在未来数个月内亮相,将对研发定制化模型的研究单位与创业公司团队有所帮助。目前还不清楚产品细节为何,或者是否会采用上述研究以做到重现回应的可能性。

Thinking Machines Lab也承诺,将定期发布文章、程序代码及研究资讯,期望“造福大众,同时提升我们自己的研究文化”。相比之下,OpenAI成立初期时也强调开放研究,如今运营规模扩大后反而走向封闭。

(首图来源:Mira Murati)