马斯克(Elon Musk)拥有的AI公司xAI发布最新旗舰模型Grok 4,并推出每月300美元的全新订阅方案SuperGrok Heavy。
Grok是xAI瞄准OpenAI ChatGPT、Google Gemini等所开发的产品,能够解析图像并回应各式各样的提问。近几个月以来,Grok深度集成马斯克所收购的社交媒体平台X中,但行为失控的状况也因此暴露在数百万用户面前。
xAI同时推出Grok 4和Grok 4 Heavy 2种模型版本,后者为“多代理版本”,能同时启动多个AI代理针对同一问题独立运行,如同读书会般相互比较成果进而找出最佳答案。xAI通过API发布Grok 4,期望吸引开发者以此模型构建AI应用。
Grok 4在多项基准测试达到领先水准,包括评估AI回答数千道数学、人文及自然科学题目的HLE(Humanity's Last Exam)。xAI指出,Grok 4未使用“工具”在HLE获得25.4%准确率,优于Gemini 2.5 Pro 21.6%和o3 21%。激活“工具”的Grok 4 Heavy甚至获得44.4%准确率,远胜Gemini 2.5 Pro 26.9%。
非营利组织Arc Prize称,Grok在ARC-AGI-2基准测试创下新纪录,这项测验包含AI用于识别视觉模式的题目,Grok 4取得16.2%,几乎是Claude Opus 4的2倍。
不只如此,xAI同场推出每月300美元的订阅方案SuperGrok Heavy,订阅用户能够抢先试用Grok 4 Heavy及其他新功能。这项方案与OpenAI、Google、Anthropic等高端方案相似,却是如今收费最昂贵的AI订阅方案。
SuperGrok Heavy用户有望优先体验xAI未来几个月预计推动新产品,包括8月的AI编码模型、9月的多模态代理、以及10月的形象生成模型。
尽管Grok在基准测试展现高水准,xAI要在商业市场击败ChatGPT、Gemini及Claude,需要克服以往失误留下的阴影。究竟企业客户是否愿意接受Grok优势与缺点并存,有待市场观察。
Introducing Grok 4, the world's most powerful AI model. Watch the livestream now:
— xAI (@xai) July 10, 2025
马斯克率领团队发布Grok 4系列模型。
(首图来源:视频截屏)