先前名为Codeium的AI创业公司Windsurf周四(5/15)发布首个模型家族SWE-1,同时标榜这是针对整个软件工程程序进行优化的模型,并不只着重于写程序。

该公司创立于2021年,早期名为Exafunction,是个GPU虚拟化公司;在意识到生成式AI的潜力之后,借由既有的基础设施创建了一个全栈式的AI程序代码撰写平台Codeium,并在2022年更名为Codeium;今年再更名为Windsurf,并推出首个模型家族SWE-1。

SWE-1是一个打算完成所有软件工程程序的概念性验证模型,Windsurf解释,阅读或撰写程序代码只是软件工程的一小部分,真正的挑战在于实现能够长期扩展的解决方案,该公司的目标是将软件开发速度提高99%。因此,SWE-1基于Windsurf Editor的用户互动数据,创建了共享时间轴,以捕捉工程中的不完整状态与跨表面任务;另也具备流程感知能力,能与人类无缝协作,即时观察及修正彼此行动。

SWE-1现有3种规格,分别是SWE-1、SWE-1-lite与SWE-1-mini。其中,标准版的SWE-1具备类似Claude Sonnet 3.5等级的工具调用推理能力,但更为便宜;SWE-1-lite则是用来取代该公司既有的软件开发基础模型Cascade Base;SWE-1-mini则是最小也最快的模型,用以支持Windsurf Tab的被动式体验。

脱机测试时,在由AI继续半完成任务的Conversational SWE Task基准测试中,SWE-1的表现接近Anthropic的Claude Sonnet 3.5/3.7模型,并优于开源的Deepseek与Qwen;而在端对端的End-To-End SWE Task基准测试中,SWE-1的表现则接近Claude Sonnet 3.7,并胜过Claude Sonnet 3.5与Deepseek V3。

图片来源/Windsurf

在生产环境中,盲测显示SWE-1的程序代码贡献接受度仅次于Claude Sonnet 3.7,但超越Claude Sonnet 3.5;在编辑参与度上则超越了Claude Sonnet 3.5/3.7。

Windsurf在去年8月完成1.5亿美元的C轮增资,当时公司估值为12.5亿美元。