机器之心报道
机器之心编辑部
嘿,Cursor 终于开始自己研发大型语言模型了!
Cursor 2.0 终于来了!
刚刚,Cursor 发布了两项重磅更新:第一个编码模型 Composer,还有一个新界面,能让多个智能体一起协作。


这可是个大事件哦!虽然 Cursor 一直受欢迎,但大家总是把它称作「AI 时代的 VS Code」,因为之前它只能使用一些第三方模型,比如 Claude 和 GPT。这既是它的起点,也成了限制它发展的一个短板。
而 Composer 的推出,实际上是 Cursor 破除这个短板的自我宣告,标志着它从「AI 外壳」成功转型为「AI 原生平台」。
自研模型 Composer
Composer 是一款超级前沿的模型,虽然它的智能水平比不得 GPT-5 等顶尖模型,但在速度上却领先一大截,竟然达到了同类智能模型的四倍!

在一些基准测试中,Composer 达到了顶尖的编码智能水平,生成速度更是惊人,能每秒处理 250 个 token—— 这可是领先的快速推理模型的两倍,甚至是同类前沿系统的四倍!(顺便提一下,Cursor 发布的对比中将模型分为几个类别,包括「最佳开源」(像 Qwen Coder、GLM 4.6)、「快速前沿」(Haiku 4.5、Gemini Flash 2.5)、「2025 年 7 月前沿」(年中可用的最强模型)和「最佳前沿」(如 GPT-5 和 Claude Sonnet 4.5)。Composer 不仅在智能水平上跟中端前沿系统相当,还在所有测试类别中创造了生成速度的新纪录。)
让编码更轻松的Composer模型,你了解吗?

这个模型专门为Cursor设计,能在短短30秒内完成大部分任务,帮助你快速编码。早期的使用者表示,它的快速反馈和迭代让人印象深刻,大家都很乐意把复杂的多步骤编码交给它。
据官方介绍,Composer的训练依赖于一系列强大的工具,包括全面覆盖整个代码库的语义搜索,这让它在理解和处理大规模代码库时显得特别有优势。


具体来说,Composer在训练时使用了一系列专业的搜索和编辑工具,它被要求快速高效地解决各种复杂问题。
这个模型的诞生,与Cursor团队在开发自己的补全模型Cursor Tab时积累的经验密切相关。
团队发现,开发者们往往希望有一个既聪明又能与他们互动的模型,以便在编码时保持专注和流畅。因此,他们尝试了一个代号为Cheetah的智能体原型,深入理解高效智能体模型的作用。而Composer就是在此基础上进一步优化的版本,它的速度让交互体验更顺滑,编码过程也更加愉快。

从架构角度看,Composer是一种混合专家模型(MoE),可以生成和理解长上下文。它通过在多样化的开发环境中进行强化学习,针对软件工程进行了特别优化。在每次训练中,模型都会接收具体的问题描述,并被要求给出最佳的响应,无论是修改代码、规划方案,还是提供信息性回答。它不仅能够使用简单的文件读取和编辑工具,还能调用更强大的功能,比如终端命令和广泛的代码库语义搜索。
让软件开发变得更简单的Cursor 2.0
为了更好地评估进展,Cursor团队特意设计了一套与开发者实际需求高度契合的测试标准。这个被称为Cursor Bench的新基准测试,结合了工程师和研究人员提交的真实智能体请求,并配上了人工精心整理的最佳答案。测试不仅关注智能体的准确性,还评估它们在遵循现有代码库和软件工程实践方面的表现。

通过强化学习,他们得以针对性地优化模型,使其更好地适应快速的软件开发环境。你知道吗,响应速度对交互式开发至关重要,因此他们鼓励模型在使用工具时做出聪明的选择,并尽可能地进行并行处理。此外,他们还通过减少不必要的回答和避免无根据的说法来训练模型。令人惊讶的是,在这个强化学习的过程中,模型还自学到了一些很实用的技能,比如执行复杂搜索、修复代码中的错误,以及编写和运行单元测试。

Cursor的开发团队已经在日常工作中把Composer投入使用,这其实是对其成熟度和稳定性的一个很好的证明。
现在,Composer已经完全融入到Cursor 2.0版本中,这次更新为公司的智能开发环境带来了重大变化。
多智能体界面
Cursor的界面设计也进行了全面升级。
他们的博客提到,这个新版本更加专注于“智能体”本身,而不是过去那种传统的文件结构。这种设计让用户可以更集中地关注想要实现的结果,而繁琐的细节则交给智能体处理。当需要深入代码时,用户还可以轻松打开文件,或者切换回熟悉的经典IDE界面。

Cursor 2.0的一个亮点是可以轻松并行运行多个智能体,它们之间不会相互干扰。这得益于git worktree和远程机器的支持。Cursor表示:“我们甚至发现,让多个模型同时解决同一个问题,然后选择最佳结果,能显著提高最终的效果,尤其是在面对更复杂的任务时。”
Cursor的新变化:让AI编程更高效

在每个开发者的博客中,提到了一些测试案例。比如在上面的图表中,你可以看到三个不同模型在进行同样的任务:Composer 1 Alpha被运行了两次,而Grok Code则运行了一次。

这篇博客提到,现在开发者们可以同时让多个AI智能体工作,每个智能体负责项目中的不同部分,这些部分被称为“工作树”。想象一下,像一群实习生,各自负责文章的不同章节,同时向我汇报进展。
另外,Cursor的团队还指出,随着他们越来越多地使用智能体进行编码,出现了两个新的挑战:代码审查和变更测试。
为了应对这些问题,Cursor 2.0开始着手解决这两个瓶颈,支持更快地审阅智能体的变更,并在需要的时候深入查看代码。
此外,他们还推出了原生浏览器工具,方便Cursor可以测试其工作并不断迭代,直到得到正确的最终结果。

基础设施建设
为了高效训练大型MoE模型,团队在基础设施和系统研究上投入了大量资源。他们基于PyTorch和Ray构建了定制的训练基础设施,支持在大规模环境下进行异步强化学习。通过结合MXFP8 MoE内核与专家并行和混合分片数据并行,他们可以在原生低精度下训练模型,从而以极小的通信开销将训练扩展到数千个NVIDIA GPU。而采用MXFP8训练方式,还能在无需训练后量化的情况下实现更快的推理速度。
在进行强化学习时,团队希望模型能够随时调用Cursor Agent框架中的各种工具。这些工具可以用来编辑代码、进行语义搜索、使用grep查找字符串,甚至运行终端命令。为了让模型高效地使用这些工具,Cursor需要在云端并发运行数十万个独立的沙盒编码环境。因此,团队对现有的Background Agents基础设施进行了改造,重写了虚拟机调度器,以适应训练运行的突发性和规模,从而实现了强化学习环境与生产环境的无缝衔接。
网友反馈
作为一款备受瞩目的AI编程工具,Cursor的这次重大版本更新自然吸引了很多人的关注。
参与早期测试的开发者们纷纷给出了他们的反馈意见,博客every.to也整理了不少开发者的看法,既有赞美也有批评。
网友们的Cursor 2.0体验分享


在社交媒体上,大家也纷纷分享了他们对Cursor的使用体验。

有些人甚至开玩笑说可以用Cursor 2.0来造个通用人工智能呢!

想了解更详细信息?这里有一些链接:
https://x.com/cursor_ai/status/1983567619946147967
https://cursor.com/blog/2-0
https://every.to/vibe-check/vibe-check-cursor-2-0-and-composer-1-alpha
https://cursor.com/cn/changelog/2-0
文中提到的视频链接:https://mp.weixin.qq.com/s/SOYp-wIq3YE_DbgppqhALg
