AI 编程助手四月格局:Cursor Composer 2 与 Claude Code 泄露事件
四月的 AI 编程助手市场比预期更热闹。一边是 Cursor 发布第三代编程模型 Composer 2,另一边是 Anthropic 意外将 Claude Code 的完整源码泄露到 npm。两件事发生在同一周,恰好勾勒出这个市场的两种走向:产品能力的军备竞赛,和基础设施的意外透明化。
Cursor Composer 2:专精模型的胜利
3 月 19 日,Cursor 发布了 Composer 2。这不是简单的版本迭代,而是 Cursor 对”通用大模型 vs 专用编程模型”这个问题的明确回答。
Composer 2 基于 Moonshot AI 的 Kimi K2.5 架构,经过持续的预训练和强化学习微调。从公布的数据来看,提升幅度相当显著:
| 基准测试 | Composer 2 | Composer 1.5 | 提升 |
|---|---|---|---|
| CursorBench | 61.3 | 44.2 | +37% |
| Terminal-Bench 2.0 | 61.7 | 47.9 | +29% |
| SWE-bench Multilingual | 73.7 | 65.9 | +12% |
最值得注意的是 Self-Summarization 技术。Cursor 官方解释称,这项技术让模型能够压缩历史上下文,在超长编程会话中保持连贯性。对于经常需要同时处理十几个文件的开发者来说,这意味着模型不会在会话后期”忘记”之前的文件状态。
定价方面,Composer 2 的输入 token 成本是 $0.50/百万,输出 $2.50/百万。作为对比,Claude Sonnet 4.6 是 $3/$15,Opus 4.6 是 $5/$25。这个差价对于高频使用者来说相当可观。
Cursor 的策略很清晰:把编程场景吃透,用专精模型在特定领域击败通用模型。
Claude Code 源码泄露:意外的透明
3 月 31 日,安全研究员 Chaofan Shou 发现 Anthropic 在 npm 发布的 Claude Code v2.1.88 包中包含了一个 .map 文件,里面是完整的 TypeScript 源码:51.2 万行代码,1,893 个文件,59.8 MB。
Anthropic 的反应很快,下架了相关包并申请了版权删除。但代码已经扩散。GitHub 上出现了多个整理版本,有人甚至搭建了在线浏览站点。
泄露的内容包括:
- 44 个隐藏的功能开关
- 未发布的 “Mythos” AI 模型引用
- 持久化记忆功能的多代理工作树
- 95+ 个 slash 命令的实现
- 一个 Tamagotchi 宠物彩蛋(没错,真的有人写了一个)
从工程角度看,Claude Code 的架构设计相当干净。模块化程度高,工具系统和命令系统分离清晰。这也是为什么泄露后社区能够快速理解和复现它的工作原理。
这件事的影响还在发酵。一方面,竞争对手现在可以精确研究 Claude Code 的实现细节;另一方面,开源社区对 Claude Code 的理解加深,可能会催生更多基于类似架构的开源工具。
GitHub Copilot 的应对
夹在 Cursor 和 Claude Code 之间,GitHub Copilot 也没闲着。3 月份 Copilot 完成了几个重要更新:
Agent Mode GA:之前只在 VS Code 上可用的 Agent Mode 现在支持 JetBrains,可以处理多步骤编码任务——读取文件、生成代码、运行终端命令、自动迭代错误。
Agentic Code Review:Copilot 的代码审查现在会先收集完整的项目上下文,不只是 diff,还包括相关文件、测试模式和风格约定。更关键的是,它可以直接将建议传递给编码代理生成修复 PR。
Semantic Code Search:语义搜索可以找到概念相关的代码,而不是关键词匹配。描述一个登录 bug,它能定位到认证中间件和会话处理逻辑,即使那些文件里根本没有”login”这个词。
Copilot 的优势始终是生态。它支持 VS Code、JetBrains、Neovim、Xcode、Eclipse、Zed 等十几种 IDE。对于使用多种 IDE 的组织来说,这是 Cursor 和 Claude Code 暂时无法匹敌的。
怎么选?
这三个工具代表了三种不同的哲学:
- Cursor:IDE 本身应该是智能的,AI 不是插件,而是编辑体验的核心
- GitHub Copilot:在开发者已有的工具链里增强能力,不替换编辑器
- Claude Code:委托而非辅助,描述你想要的结果,AI 自主规划和执行
我的判断是:
- 如果你主要在 VS Code 上写代码,Cursor 值得尝试。Composer 2 的性价比优势明显。
- 如果你的团队使用多种 IDE,或者需要企业级合规,Copilot 仍然是安全选择。
- 如果你经常处理复杂重构、架构决策,或者需要处理大型代码库,Claude Code 的 200K 上下文窗口和深度理解能力不可替代。
当然,泄露事件之后,Claude Code 的竞争优势在一定程度上被削弱了。但这是短期波动,长期看 Anthropic 的技术实力依然强劲。
最后
AI 编程助手市场正在从”谁的功能多”转向”谁的专精深”。Cursor 用 Composer 2 证明了专用模型的价值,Claude Code 的泄露意外展示了优秀工程的内部结构,而 Copilot 则在生态整合上继续深耕。
对于开发者来说,这是好事。竞争越激烈,工具就越好用。
文章发表于 gumi.ink