特斯拉与SpaceX首席执行官Elon Musk在X(原Twitter)上发文,宣布旗下AI公司xAI将于下周推出Grok 3.5,该消息更被他置顶,可见其高度重视。
根据马斯克说法,Grok 3.5是首个能精准回答火箭引擎与电化学技术问题的AI模型,还能通过“第一性原理”推理出网络上未曾存在的答案。xAI将其定位为“全球首个能从第一原理进行深度推理的AI”,强调其与其他模型的根本差异。
今年2月,xAI推出了Grok 3,并在两天后全面开放免费使用,一度超越ChatGPT登上苹果App Store免费下载榜首,马斯克当时更宣称其为“地球上最聪明的人工智能”。
这次Grok 3.5的发布时间点颇具巧合——就在阿里正式开源Qwen3之后不久。Qwen3不仅在多项国际评测中击败包括OpenAI-o1与DeepSeek-R1等多款顶尖模型,更打破多项记录。
Qwen3为中国首款“混合推理模型”,具备快慢思考模式,可针对简单任务以低算力秒回、对复杂任务多步推理。该模型在GPQA、AIME25、LiveCodeBench等测试中表现出色——在AIME25奥数级评测中拿下81.5分,创下开源记录,在程序代码评估LiveCodeBench上也突破70分,甚至超过Grok 3。
值得注意的是,Qwen3不仅性能强劲,部署成本也大幅下降。只需4张H20 GPU即可部署完整模型,显存需求仅为同等级模型的三分之一。
随着AI巨头持续交锋,Grok 3.5与Qwen3谁更强,将成为近期生成式AI圈的关注焦点。