Cursor 2.0重磅发布，自研模型Composer引领新潮流！

机器之心报道

机器之心编辑部

嘿，Cursor 终于开始自己研发大型语言模型了！

Cursor 2.0 终于来了！

刚刚，Cursor 发布了两项重磅更新：第一个编码模型 Composer，还有一个新界面，能让多个智能体一起协作。

这可是个大事件哦！虽然 Cursor 一直受欢迎，但大家总是把它称作「AI 时代的 VS Code」，因为之前它只能使用一些第三方模型，比如 Claude 和 GPT。这既是它的起点，也成了限制它发展的一个短板。

而 Composer 的推出，实际上是 Cursor 破除这个短板的自我宣告，标志着它从「AI 外壳」成功转型为「AI 原生平台」。

自研模型 Composer

Composer 是一款超级前沿的模型，虽然它的智能水平比不得 GPT-5 等顶尖模型，但在速度上却领先一大截，竟然达到了同类智能模型的四倍！

在一些基准测试中，Composer 达到了顶尖的编码智能水平，生成速度更是惊人，能每秒处理 250 个 token—— 这可是领先的快速推理模型的两倍，甚至是同类前沿系统的四倍！（顺便提一下，Cursor 发布的对比中将模型分为几个类别，包括「最佳开源」（像 Qwen Coder、GLM 4.6）、「快速前沿」（Haiku 4.5、Gemini Flash 2.5）、「2025 年 7 月前沿」（年中可用的最强模型）和「最佳前沿」（如 GPT-5 和 Claude Sonnet 4.5）。Composer 不仅在智能水平上跟中端前沿系统相当，还在所有测试类别中创造了生成速度的新纪录。）

让编码更轻松的Composer模型，你了解吗？

这个模型专门为Cursor设计，能在短短30秒内完成大部分任务，帮助你快速编码。早期的使用者表示，它的快速反馈和迭代让人印象深刻，大家都很乐意把复杂的多步骤编码交给它。

据官方介绍，Composer的训练依赖于一系列强大的工具，包括全面覆盖整个代码库的语义搜索，这让它在理解和处理大规模代码库时显得特别有优势。

具体来说，Composer在训练时使用了一系列专业的搜索和编辑工具，它被要求快速高效地解决各种复杂问题。

这个模型的诞生，与Cursor团队在开发自己的补全模型Cursor Tab时积累的经验密切相关。

团队发现，开发者们往往希望有一个既聪明又能与他们互动的模型，以便在编码时保持专注和流畅。因此，他们尝试了一个代号为Cheetah的智能体原型，深入理解高效智能体模型的作用。而Composer就是在此基础上进一步优化的版本，它的速度让交互体验更顺滑，编码过程也更加愉快。

从架构角度看，Composer是一种混合专家模型（MoE），可以生成和理解长上下文。它通过在多样化的开发环境中进行强化学习，针对软件工程进行了特别优化。在每次训练中，模型都会接收具体的问题描述，并被要求给出最佳的响应，无论是修改代码、规划方案，还是提供信息性回答。它不仅能够使用简单的文件读取和编辑工具，还能调用更强大的功能，比如终端命令和广泛的代码库语义搜索。

让软件开发变得更简单的Cursor 2.0

为了更好地评估进展，Cursor团队特意设计了一套与开发者实际需求高度契合的测试标准。这个被称为Cursor Bench的新基准测试，结合了工程师和研究人员提交的真实智能体请求，并配上了人工精心整理的最佳答案。测试不仅关注智能体的准确性，还评估它们在遵循现有代码库和软件工程实践方面的表现。

通过强化学习，他们得以针对性地优化模型，使其更好地适应快速的软件开发环境。你知道吗，响应速度对交互式开发至关重要，因此他们鼓励模型在使用工具时做出聪明的选择，并尽可能地进行并行处理。此外，他们还通过减少不必要的回答和避免无根据的说法来训练模型。令人惊讶的是，在这个强化学习的过程中，模型还自学到了一些很实用的技能，比如执行复杂搜索、修复代码中的错误，以及编写和运行单元测试。

Cursor的开发团队已经在日常工作中把Composer投入使用，这其实是对其成熟度和稳定性的一个很好的证明。

现在，Composer已经完全融入到Cursor 2.0版本中，这次更新为公司的智能开发环境带来了重大变化。

多智能体界面

Cursor的界面设计也进行了全面升级。

他们的博客提到，这个新版本更加专注于“智能体”本身，而不是过去那种传统的文件结构。这种设计让用户可以更集中地关注想要实现的结果，而繁琐的细节则交给智能体处理。当需要深入代码时，用户还可以轻松打开文件，或者切换回熟悉的经典IDE界面。

Cursor 2.0的一个亮点是可以轻松并行运行多个智能体，它们之间不会相互干扰。这得益于git worktree和远程机器的支持。Cursor表示：“我们甚至发现，让多个模型同时解决同一个问题，然后选择最佳结果，能显著提高最终的效果，尤其是在面对更复杂的任务时。”

Cursor的新变化：让AI编程更高效

在每个开发者的博客中，提到了一些测试案例。比如在上面的图表中，你可以看到三个不同模型在进行同样的任务：Composer 1 Alpha被运行了两次，而Grok Code则运行了一次。

这篇博客提到，现在开发者们可以同时让多个AI智能体工作，每个智能体负责项目中的不同部分，这些部分被称为“工作树”。想象一下，像一群实习生，各自负责文章的不同章节，同时向我汇报进展。

另外，Cursor的团队还指出，随着他们越来越多地使用智能体进行编码，出现了两个新的挑战：代码审查和变更测试。

为了应对这些问题，Cursor 2.0开始着手解决这两个瓶颈，支持更快地审阅智能体的变更，并在需要的时候深入查看代码。

此外，他们还推出了原生浏览器工具，方便Cursor可以测试其工作并不断迭代，直到得到正确的最终结果。

基础设施建设

为了高效训练大型MoE模型，团队在基础设施和系统研究上投入了大量资源。他们基于PyTorch和Ray构建了定制的训练基础设施，支持在大规模环境下进行异步强化学习。通过结合MXFP8 MoE内核与专家并行和混合分片数据并行，他们可以在原生低精度下训练模型，从而以极小的通信开销将训练扩展到数千个NVIDIA GPU。而采用MXFP8训练方式，还能在无需训练后量化的情况下实现更快的推理速度。

在进行强化学习时，团队希望模型能够随时调用Cursor Agent框架中的各种工具。这些工具可以用来编辑代码、进行语义搜索、使用grep查找字符串，甚至运行终端命令。为了让模型高效地使用这些工具，Cursor需要在云端并发运行数十万个独立的沙盒编码环境。因此，团队对现有的Background Agents基础设施进行了改造，重写了虚拟机调度器，以适应训练运行的突发性和规模，从而实现了强化学习环境与生产环境的无缝衔接。

网友反馈

作为一款备受瞩目的AI编程工具，Cursor的这次重大版本更新自然吸引了很多人的关注。

参与早期测试的开发者们纷纷给出了他们的反馈意见，博客every.to也整理了不少开发者的看法，既有赞美也有批评。