Windsurf发布专为软件工程师构建的SWE-1模型

先前名为Codeium的AI创业公司Windsurf周四（5/15）发布首个模型家族SWE-1，同时标榜这是针对整个软件工程程序进行优化的模型，并不只着重于写程序。

该公司创立于2021年，早期名为Exafunction，是个GPU虚拟化公司；在意识到生成式AI的潜力之后，借由既有的基础设施创建了一个全栈式的AI程序代码撰写平台Codeium，并在2022年更名为Codeium；今年再更名为Windsurf，并推出首个模型家族SWE-1。

SWE-1是一个打算完成所有软件工程程序的概念性验证模型，Windsurf解释，阅读或撰写程序代码只是软件工程的一小部分，真正的挑战在于实现能够长期扩展的解决方案，该公司的目标是将软件开发速度提高99%。因此，SWE-1基于Windsurf Editor的用户互动数据，创建了共享时间轴，以捕捉工程中的不完整状态与跨表面任务；另也具备流程感知能力，能与人类无缝协作，即时观察及修正彼此行动。

SWE-1现有3种规格，分别是SWE-1、SWE-1-lite与SWE-1-mini。其中，标准版的SWE-1具备类似Claude Sonnet 3.5等级的工具调用推理能力，但更为便宜；SWE-1-lite则是用来取代该公司既有的软件开发基础模型Cascade Base；SWE-1-mini则是最小也最快的模型，用以支持Windsurf Tab的被动式体验。

脱机测试时，在由AI继续半完成任务的Conversational SWE Task基准测试中，SWE-1的表现接近Anthropic的Claude Sonnet 3.5/3.7模型，并优于开源的Deepseek与Qwen；而在端对端的End-To-End SWE Task基准测试中，SWE-1的表现则接近Claude Sonnet 3.7，并胜过Claude Sonnet 3.5与Deepseek V3。