机器之心编辑部
终于,Cursor 这次真的决定自己训练大型语言模型了!
Cursor 2.0 终于上线了!
最近,Cursor 发布了两项重要更新:首个编码模型 Composer,以及一个全新的界面,方便多个智能体并行协作。


https://www.zhihu.com/video/1967172485960152592
这可是个大动作!虽然 Cursor 一直备受欢迎,但之前总被称为“AI 时代的 VS Code”,因为它只能依赖 Claude、GPT 等外部模型。这既是它的起点,也成了限制。
而 Composer 的推出,简直就是 Cursor 打破束缚的“宣言”,意味着它从一个“AI 外壳”升级为“AI 原生平台”。
自研模型 Composer
Composer 是一款非常前沿的模型,虽然在智能程度上比不上 GPT-5 等顶尖模型,但它的速度可是非常惊人,达到了同类智能模型的四倍!

在基准测试中,Composer 表现出色,不仅在编码智能上达到了前沿水平,生成速度也高达每秒 250 个 token——这可是领先的快速推理模型的两倍,也是同类系统的四倍!(注:Cursor 的对比将模型分为几类,如“最佳开源”(如 Qwen Coder、GLM 4.6)、“快速前沿”(Haiku 4.5、Gemini Flash 2.5)、“2025 年 7 月前沿”(年中可用的最强模型)以及“最佳前沿”(包括 GPT-5 和 Claude Sonnet 4.5)。Composer 在中端前沿系统智能水平上表现出色,同时在所有测试类别中创造了最高的生成速度。)

这款模型特别设计用于 Cursor 中的低延迟智能编码,大多数回合都能在 30 秒内完成。早期的用户反馈表示,它的快速迭代能力让人觉得特别顺手,大家都愿意让它处理复杂的编码任务。
官方强调,Composer 在训练过程中使用了一系列强大的工具,包括对整个代码库的语义搜索,因而在理解和处理大型代码库时表现得格外出色。


https://www.zhihu.com/video/1967172631775155338
具体来说,Composer 在训练时使用了一套生产级的搜索和编辑工具,旨在高效解决各种棘手的问题。
这个模型的研发灵感来源于 Cursor 团队在开发 Cursor Tab(自家的补全模型)时的经历。
他们发现,开发者希望使用既智能又能支持互动的模型,以便保持编码的专注与流畅。在研发过程中,团队试验了一个代号为 Cheetah 的原型模型,以更好地理解高速智能体的影响。Composer 就是这个模型的智能升级版,凭借高速度保证了互动体验,让编码过程更加愉快与流畅。

从结构上看,Composer 是种混合专家(MoE)模型,支持长上下文的生成和理解。它通过多样化的开发环境进行强化学习,专门针对软件工程进行了优化。在每次训练中,模型会接收问题描述,并被要求给出最佳回应,无论是代码修改、方案规划,还是信息性回答。模型不仅能使用简单的文件读取与编辑工具,还能调用更强大的功能,如终端命令和针对整个代码库的语义搜索。
为了评估进展,他们创建了一套尽可能贴近软件开发者实际使用需求的评测系统。新基准测试 Cursor Bench 由 Cursor 的工程师和研究人员提交的真实智能体请求组成,并配有人工整理的最佳解决方案。这项评测不仅考察智能体的正确性,还评估其对代码库的抽象理解及软件工程实践的遵循程度。

强化学习让他们能够有针对性地优化模型,使其更好地服务于高效的软件工程。因为响应速度在交互式开发中至关重要,他们鼓励模型在使用工具时做出高效选择,并在可能的情况下实现并行处理。此外,他们通过减少不必要的回复、避免无根据的陈述来训练模型。他们还发现,在强化学习过程中,模型自然而然地掌握了一些有用的能力,比如执行复杂搜索、修复 linter 错误,以及编写并运行单元测试。

现在,Composer 已经被 Cursor 自己的工程团队在日常开发中广泛使用,充分证明了它的成熟度和稳定性。
现在,Composer 已完全集成到 Cursor 2.0 中,这次更新真的是一次重大飞跃。
多智能体界面
Cursor 的界面设计也进行了全新改版。
官方博客提到,这一版本更加聚焦,彻底以“智能体”为中心,而不是传统的文件结构。这样用户就能专注于想要的结果,让智能体去处理那些繁琐的细节。需要深入代码时,用户也能轻松在新布局中打开文件,或切换回经典 IDE 界面。

Cursor 2.0 能够轻松并行运行多个智能体,它们之间不会互相干扰。这得益于 git worktree 或远程机器的支持。Cursor 表示:“我们甚至发现,让多个模型同时尝试同一个问题并择优选择,能显著提升最终结果,尤其是在更复杂的任务上。”

https://www.zhihu.com/video/1967172891201214298
every.to 的博客分享了一些测试示例,比如在下面的示例中,顶部栏中可以看到三个不同的模型在执行相同的任务:Composer 1 Alpha 运行了两次,Grok Code 运行了一次:

该博客指出:“现在,开发者可以同时运行多个 AI 智能体,每个智能体负责项目的不同部分,每个部分被称为一个工作树(work tree)。这就像一群实习生各自负责文章的不同章节,并同时向我汇报进展。”
另外,Cursor 官方提到,随着他们越来越多地使用智能体进行编码,出现了两个新的瓶颈:代码评审与变更测试。
Cursor 2.0 也开始解决这两个问题,支持更快捷地审阅智能体的变更,并在需要时深入代码。
同时,他们还构建了原生的浏览器工具,使 Cursor 能够测试其工作并持续迭代,直到产生正确的最终结果。

https://www.zhihu.com/video/1967172842773778761
基础设施
要高效训练大型 MoE 模型,团队在基础设施和系统研究上投入了不少精力。通过使用 PyTorch 和 Ray,他们打造了一个专门的训练平台,能够在大规模的环境中支持异步强化学习。他们把 MXFP8 MoE 内核与专家并行和混合数据并行的方式结合起来,在原生低精度下进行模型训练,这样就能大幅度降低通信开销,将训练扩展到成千上万的 NVIDIA GPU。此外,使用 MXFP8 进行训练还可以让推理速度变得更快,而不需要进行后期的量化处理。
在强化学习的过程中,团队希望模型能够灵活使用 Cursor Agent 框架里的各种工具。这些工具可以用来编辑代码、进行语义搜索、利用 grep 查找字符串,甚至执行终端命令。为了让模型高效地调用这些工具,Cursor 的规模要求他们在云端并发运行数十万份隔离的沙盒编码环境。因此,团队对现有的 Background Agents 基础设施进行了升级,重写了虚拟机调度器,以适应训练过程中出现的突发性和大规模需求。最终,他们成功将 RL 环境与生产环境无缝地结合在一起。
网友评论
作为一款备受关注的 AI 编程工具,Cursor 的这次重大更新无疑引起了很多人的关注。
早期体验过的开发者们纷纷表示赞赏。比如 every.to 的博客就整理了不少开发者的反馈意见,既有好评也有不足之处:


在 X 平台上,许多网友也分享了自己的使用体验。

甚至有人开玩笑说希望 Cursor 2.0 能用来构建 AGI:

相关链接:
https://x.com/cursor_ai/status/1983567619946147967
https://cursor.com/blog/2-0
https://every.to/vibe-check/vibe-check-cursor-2-0-and-composer-1-alpha
https://cursor.com/cn/changelog/2-0
文中视频链接:https://mp.weixin.qq.com/s/SOYp-wIq3YE_DbgppqhALg










这个Composer模型真是太厉害了,速度都快到炸裂,编程效率提升不少!
这个新模型听起来像是给开发者送来了春天,编码不再枯燥。
这个Composer模型的速度真让人惊讶,编码效率提升明显,开发者们可要抓住机会了。
这款Composer模型的速度真是令人咋舌,难道它会成为开发者的最佳拍档?
Composer的速度确实很快,听说跟同行比起来有四倍的优势,是真的吗?这样会不会对质量有影响?
Cursor 2.0的更新很有冲击力,希望能进一步优化用户体验,特别是交互部分。
如果Composer能更好地支持多种编程语言,那将更具吸引力。
假如Composer在处理复杂代码时还能保持稳定性,那真是太棒了!
Composer的语义搜索能力应该能帮助开发者更好地理解代码库,期待它的实际效果。