哇，Cursor 2.0来了！自研模型Composer强势出击，不再只是个外壳！

嘿，机器之心来报道啦！

机器之心编辑部

终于，Cursor 这次真的决定自己训练大型语言模型了！

Cursor 2.0 终于上线了！

最近，Cursor 发布了两项重要更新：首个编码模型 Composer，以及一个全新的界面，方便多个智能体并行协作。

哇，Cursor 2.0来了！自研模型Composer强势出击，不再只是个外壳！

https://www.zhihu.com/video/1967172485960152592

这可是个大动作！虽然 Cursor 一直备受欢迎，但之前总被称为“AI 时代的 VS Code”，因为它只能依赖 Claude、GPT 等外部模型。这既是它的起点，也成了限制。

而 Composer 的推出，简直就是 Cursor 打破束缚的“宣言”，意味着它从一个“AI 外壳”升级为“AI 原生平台”。

自研模型 Composer

Composer 是一款非常前沿的模型，虽然在智能程度上比不上 GPT-5 等顶尖模型，但它的速度可是非常惊人，达到了同类智能模型的四倍！

在基准测试中，Composer 表现出色，不仅在编码智能上达到了前沿水平，生成速度也高达每秒 250 个 token——这可是领先的快速推理模型的两倍，也是同类系统的四倍！(注：Cursor 的对比将模型分为几类，如“最佳开源”（如 Qwen Coder、GLM 4.6）、“快速前沿”（Haiku 4.5、Gemini Flash 2.5）、“2025 年 7 月前沿”（年中可用的最强模型）以及“最佳前沿”（包括 GPT-5 和 Claude Sonnet 4.5）。Composer 在中端前沿系统智能水平上表现出色，同时在所有测试类别中创造了最高的生成速度。）

这款模型特别设计用于 Cursor 中的低延迟智能编码，大多数回合都能在 30 秒内完成。早期的用户反馈表示，它的快速迭代能力让人觉得特别顺手，大家都愿意让它处理复杂的编码任务。

官方强调，Composer 在训练过程中使用了一系列强大的工具，包括对整个代码库的语义搜索，因而在理解和处理大型代码库时表现得格外出色。

哇，Cursor 2.0来了！自研模型Composer强势出击，不再只是个外壳！

https://www.zhihu.com/video/1967172631775155338

具体来说，Composer 在训练时使用了一套生产级的搜索和编辑工具，旨在高效解决各种棘手的问题。

这个模型的研发灵感来源于 Cursor 团队在开发 Cursor Tab（自家的补全模型）时的经历。

他们发现，开发者希望使用既智能又能支持互动的模型，以便保持编码的专注与流畅。在研发过程中，团队试验了一个代号为 Cheetah 的原型模型，以更好地理解高速智能体的影响。Composer 就是这个模型的智能升级版，凭借高速度保证了互动体验，让编码过程更加愉快与流畅。

从结构上看，Composer 是种混合专家（MoE）模型，支持长上下文的生成和理解。它通过多样化的开发环境进行强化学习，专门针对软件工程进行了优化。在每次训练中，模型会接收问题描述，并被要求给出最佳回应，无论是代码修改、方案规划，还是信息性回答。模型不仅能使用简单的文件读取与编辑工具，还能调用更强大的功能，如终端命令和针对整个代码库的语义搜索。

为了评估进展，他们创建了一套尽可能贴近软件开发者实际使用需求的评测系统。新基准测试 Cursor Bench 由 Cursor 的工程师和研究人员提交的真实智能体请求组成，并配有人工整理的最佳解决方案。这项评测不仅考察智能体的正确性，还评估其对代码库的抽象理解及软件工程实践的遵循程度。

强化学习让他们能够有针对性地优化模型，使其更好地服务于高效的软件工程。因为响应速度在交互式开发中至关重要，他们鼓励模型在使用工具时做出高效选择，并在可能的情况下实现并行处理。此外，他们通过减少不必要的回复、避免无根据的陈述来训练模型。他们还发现，在强化学习过程中，模型自然而然地掌握了一些有用的能力，比如执行复杂搜索、修复 linter 错误，以及编写并运行单元测试。

现在，Composer 已经被 Cursor 自己的工程团队在日常开发中广泛使用，充分证明了它的成熟度和稳定性。

现在，Composer 已完全集成到 Cursor 2.0 中，这次更新真的是一次重大飞跃。

多智能体界面

Cursor 的界面设计也进行了全新改版。

官方博客提到，这一版本更加聚焦，彻底以“智能体”为中心，而不是传统的文件结构。这样用户就能专注于想要的结果，让智能体去处理那些繁琐的细节。需要深入代码时，用户也能轻松在新布局中打开文件，或切换回经典 IDE 界面。

Cursor 2.0 能够轻松并行运行多个智能体，它们之间不会互相干扰。这得益于 git worktree 或远程机器的支持。Cursor 表示：“我们甚至发现，让多个模型同时尝试同一个问题并择优选择，能显著提升最终结果，尤其是在更复杂的任务上。”

哇，Cursor 2.0来了！自研模型Composer强势出击，不再只是个外壳！

https://www.zhihu.com/video/1967172891201214298

every.to 的博客分享了一些测试示例，比如在下面的示例中，顶部栏中可以看到三个不同的模型在执行相同的任务：Composer 1 Alpha 运行了两次，Grok Code 运行了一次：

该博客指出：“现在，开发者可以同时运行多个 AI 智能体，每个智能体负责项目的不同部分，每个部分被称为一个工作树（work tree）。这就像一群实习生各自负责文章的不同章节，并同时向我汇报进展。”

另外，Cursor 官方提到，随着他们越来越多地使用智能体进行编码，出现了两个新的瓶颈：代码评审与变更测试。

Cursor 2.0 也开始解决这两个问题，支持更快捷地审阅智能体的变更，并在需要时深入代码。

同时，他们还构建了原生的浏览器工具，使 Cursor 能够测试其工作并持续迭代，直到产生正确的最终结果。

哇，Cursor 2.0来了！自研模型Composer强势出击，不再只是个外壳！

https://www.zhihu.com/video/1967172842773778761

基础设施

要高效训练大型 MoE 模型，团队在基础设施和系统研究上投入了不少精力。通过使用 PyTorch 和 Ray，他们打造了一个专门的训练平台，能够在大规模的环境中支持异步强化学习。他们把 MXFP8 MoE 内核与专家并行和混合数据并行的方式结合起来，在原生低精度下进行模型训练，这样就能大幅度降低通信开销，将训练扩展到成千上万的 NVIDIA GPU。此外，使用 MXFP8 进行训练还可以让推理速度变得更快，而不需要进行后期的量化处理。

在强化学习的过程中，团队希望模型能够灵活使用 Cursor Agent 框架里的各种工具。这些工具可以用来编辑代码、进行语义搜索、利用 grep 查找字符串，甚至执行终端命令。为了让模型高效地调用这些工具，Cursor 的规模要求他们在云端并发运行数十万份隔离的沙盒编码环境。因此，团队对现有的 Background Agents 基础设施进行了升级，重写了虚拟机调度器，以适应训练过程中出现的突发性和大规模需求。最终，他们成功将 RL 环境与生产环境无缝地结合在一起。

网友评论

作为一款备受关注的 AI 编程工具，Cursor 的这次重大更新无疑引起了很多人的关注。

早期体验过的开发者们纷纷表示赞赏。比如 every.to 的博客就整理了不少开发者的反馈意见，既有好评也有不足之处：