字节跳动的 AI 编程助手 Trae 刚刚推出了 2.0 版本,现在逐步开放给大家使用。这次更新带来了一个全新的 SOLO 模式 —— 这就像是一个拥有上下文理解能力的系统,能够根据完整的信息来规划和执行任务,支持从写代码到功能交付的全过程。
SOLO 是一个 Context Engineer,实际上就是一个能独立完成软件开发的 AI 工程师,能替代人类处理那些繁琐、重复的开发步骤。
SOLO 模式被视为 AI 从“辅助”转变为“主导”的一个重要里程碑。相较于传统的需要手动操作的智能助手或代码补全工具,SOLO 可以在理解需求的基础上,主动安排工具来完成复杂的开发任务。目前,这个系统已经支持 Web App 的完整交付,未来还会扩展到更多场景。
我注意到已经有不少开发者获得了内测资格,想问问大家对 SOLO 模式的实际使用感受如何呢?
感谢邀请,我有点小关系,毕竟我是 Trae 的核心开发者。这半年多来,我在这个领域里摸爬滚打,今天想聊聊《重生之我在大厂搞 AI Coding》。
简而言之,图多说少~
重生之我在大厂搞 AI Coding
时间线其实简单明了:
- 2022 年 11 月 15 日,我突然收到“蚂蚁大礼包”,让我不得不重新规划未来,庆幸的是,我很快就加入了字节。
- 2023 年 11 月 15 日,我接到一个电话,被召回杭州闭关室,从此负责 MarsCode Cloud IDE 团队的云工作区等相关事务,那一年真是疯狂。
- 2024 年 11 月 15 日,我再次走进闭关室,又是疯狂的半年,于是 Trae 1.0 和 2.0 的进化就这样诞生了。
我常开玩笑说,11 月 15 日是我的“受难日”,重生之我在大厂搞 AI Coding。今年的 11 月 15 日又会发生什么呢?我不知道,但心里还是有点期待的。
转眼半年过去了,上个月在火山引擎 Force 大会上,定坤的主题演讲《聊聊 AI Coding》中提到Trae 的月活跃用户已经突破百万,算是阶段性成果了。


从 MarsCode 到 Trae
熟悉我们的小伙伴应该知道,2024 年我们发布了不少与 Cloud IDE 相关的产品,比如 MarsCode Cloud IDE、Coze IDE、掘金 AI 刷题等,字节内部的 Cloud IDE 的用户覆盖面也相当广泛。
这里我得澄清一下,Cloud IDE ≠ Web IDE。从我个人的理解来看,IDE 可以分为前端交互层和业务逻辑层:
- 前端交互层可以在浏览器运行,也可以在本地 Electron 中,形式可以是完整版也可以是轻量版。
- 业务逻辑层可以在用户本地,也可以在远程的 K8S 容器里,甚至可以在浏览器的 WebContainer 中运行。
Cloud 的意思就是 Code Anywhere,这两层可以灵活组合,可以在同一台机器上,也可以通过 SSH 远程连接,甚至可以用 iPad 来使用。这就是我对 Cloud IDE 的理解。
Cloud IDE 的远程容器,我们通常称为云工作区,这里的技术挑战还是相当大的:
- 一般的微服务是非实时的,且无状态的,可以负载均衡,容量不足的时候可以慢慢扩容;
- FaaS 服务是实时调度的,但也是无状态的,所以可以提前预热;
- Cloud IDE 是实时调度 + 有状态,每个项目对应一个容器,有磁盘数据的依赖,对启动速度要求很高,用户打开时就得等着初始化和加载,才能使用。由于有磁盘代码数据,所以它是有状态的,无法负载均衡,也难以提前预热。
2024 年,我们在这方面投入了大量精力进行优化,不仅大幅度将 VSCode 转为 Rust,还深入定制 K8S,最终在性能、成本、稳定性等方面取得了不错的成果。我们的端到端启动性能 P90 达到 5 秒,而 GitHub Codespace 需要 30 秒,Google IDX 更是要 1 分钟,至少在这个指标上,我们达到了全球顶尖水平。
MarsCode 启动速度https://www.zhihu.com/video/1930983846276466605

当然,技术的成功不代表业务的成功,很多时候需要在合适的时机选择合适的方向。虽然 Cloud IDE 在字节的覆盖率很高,但作为一个面向消费者的产品,MarsCode 自然受到用户场景的限制,因为国内企业的代码难以上云,而程序员的副业项目又不足以支撑产品的可持续发展。
于是,在 2024 年 11 月 15 日,我们决定回归原点,选择从 Native IDE 这条新路出发,继续攀登 AI Coding 的高峰。当然,我依然相信 Cloud IDE 的价值,它会以全新的云端方式与我们再次相聚,殊途同归,一个都不能少。果不其然,到 2025 年中,业界也开始探索 Remote Agent 场景,而我们在这方面已经有了足够的积累,随时可以大展拳脚。

我对 AI Coding 的理解
之前在播客中也聊过这个话题:《探秘AI IDE,对话字节Trae & 迪魔王Devmore》
LLM 大模型的本质其实是预测下一个字符。相比复杂的自然语言,编程语言更加简洁、严谨且可预测,因此 AI Coding 领域成为这波浪潮中第一个找到市场契合点的产品。在这个领域的实践每天都在进步,几乎每个月都在刷新我们的认知。

AI 编程的演变:从辅助到自主
我觉得AI编程就像自动驾驶一样,经历了几个阶段:首先是AI 辅助编程 → AI 结对编程 → AI 自主编程。现在我们像Trae Builder、Cursor Composer和Windsurf Cascade等工具,正处于AI结对编程的阶段。

AI 辅助编程
代码补全
回想早期写代码时,我们主要依赖“下拉列表”来接收代码提示,选择对象的方法和属性。
随着ChatGPT的问世,我们渐渐意识到大模型其实就是预测下一个字符的工具。相比复杂的自然语言,编程语言显得更简洁和严谨,这让Copilot迅速崛起,带来了惊艳的代码补全体验。它的Ghost Text交互方式,只需轻轻一按Tab键,就能轻松采纳建议,真是让程序员们的心情大好。

不过,这种补全方式主要是针对新增的代码。于是,我们看到了Codeium和Cursor在超级补全方面的创新。举个简单的例子,假设你在做一个前端的地区下拉列表,最开始是英文的,后来你想换成中文。如果你修改了第一行的字段,再按一次Tab,下面所有字段都能一键更新。最近,我们也推出了Trae Cue超级代码补全功能。
从“代码提示”到“代码补全”,再到“超级补全”,这体现了AI编程能力的飞跃。

Trae Cue 超级补全https://www.zhihu.com/video/1930973686283896348
代码生成
接下来聊聊“代码生成”。在ChatGPT刚问世的时候,程序员们感受到的另一种震撼是它的对话式生成算法。可是,这需要在聊天机器人里逐个对话,再复制到IDE里,实在有点繁琐。
那有没有可能直接在IDE里和AI对话呢?于是,IDE里出现了SideChat等插件,比如Copilot Chat和Codeium,它们可以直接获取IDE和代码仓库中的上下文,再也不用麻烦地复制粘贴了。

虽然看起来这些功能相当高大上,其实它的原理很简单。比如你对AI说:“帮我实现这个HTTP请求函数”,它其实是在拼接一段描述:“用户在打开xx文件,光标位于xx行,当前函数名是xxx,最近访问过a、b、c文件,整个项目结构是xxx,现在用户要求在当前位置实现HTTP请求逻辑。”然后将这段描述交给大模型生成代码,最后再合并代码。是不是跟手动和ChatGPT对话的过程差不多?只是IDE为你准备好了合适的上下文。
这里的技术含量在于:项目理解、上下文裁剪、模型能力以及工程实践能力,Cursor在这方面表现出色。Claude Sonnet 3.5的出现更是标志着模型能力的重大突破,去年引发了一波热潮。
到目前为止,开发者可以在IDE里与AI共享同样的上下文,再也不需要冗长的转述。接下来需要解决的就是生成后的代码,如何自动合并到各个文件中,这就是快速应用代码合并的场景。
简单来说,就是如何让AI生成合适的代码,并自动合并到相应位置。实现方式有很多,比如全文重写、代码片段替换、Diff合并等。业界有多种实践结合使用,而Cursor则训练了一个快速应用的小模型,Trae则支持多种方式。

这两个能力的阶段,我称之为AI辅助编程。
AI 结对编程
AI Agent 是什么?
随着AI能力的不断进步,用户的需求也越来越复杂,我们更希望AI能有更多的自主性,像一个高潜力的实习生在旁边协助我们编程,这就是社区所称的AI Agent。
那么,一个典型的Agent是如何运作的呢?Manus前几天的文章提到:
『在接收用户输入后,Agent通过一系列工具来完成任务。在每次迭代中,模型根据当前上下文从预定义的动作空间中选择一个动作。然后该动作在环境中执行以产生观察结果。动作和观察结果被附加到上下文中,形成下一次迭代的输入,这个循环持续到任务完成。』
简单来说,Agent的核心是:AI具备思考能力和调度能力,同时也有环境感知能力和工具调用能力。它能感知自身所处的环境,并根据接收到的目标进行思考,拆解子任务,再调度工具来完成任务。

碎碎念:如果使用Trae时发现总是需要手动“应用”,一定要检查聊天框里有没有@builder。下次一定会优化!
Trae Agent 1.0
Trae Agent于2024年12月17日立项,经过20天的努力,大家看到了Trae 1.0版本。

在Agent 1.0的架构中,由于大模型能力还不够强大,我们的流程更多依赖于工作流,即思考→规划→执行→观察的循环。它在Trae IDE环境中运行,借助IDE的功能采集信息、构建上下文,并利用大语言模型进行思考和规划。同时,通过IDE提供的文件操作和命令行操作来进行工具调用,完成编码需求。

除了Agent的流程,还有代码知识图谱、快速应用代码合并等功能。
顺便吐槽:有时看到有人说AI IDE仅仅是LLM的外壳,真是让人无奈,因为他们连领域认知的门槛都没碰到。
Trae Agent 2.0
随着大量用户的反馈,我们收到不少意见,发现1.0架构在很多场景下的表现并不理想。同时,随着LLM大模型能力的不断提升,依赖于固定的提案+规划工作流的方式反而会限制模型的发挥。
Agent 2.0 的新突破
好吧,到了2025年4月8号,我们又一次闭关了整整21天,终于推出了Agent 2.0架构。这次的升级主要是让LLM有了更大的自主权,能够主动理解需求、感知环境,并驱动工具执行任务,获取反馈,这样就能更好地发挥LLM的强大能力。

与此同时,我们针对各种工具进行了特别优化。例如,File工具的代码合并成功率得到了提升,代码召回也变得更加抽象,转而采用了Search Codebase工具,方便AI按需调用,并且支持语义化的多路召回。
和AI斗智斗勇的过程其实挺折磨人的,分享一个PUA的案例给大家:
- 背景:我们希望在不降低效果的前提下,让AI用更少的轮次完成任务。
- 方法:PUA一下它,告诉它只有N轮机会,让它感受到紧迫感。
- 结果:在claude 3.5中效果非常显著,轮次明显减少。
- 意外:然而在claude 3.7中,AI反而变得懒惰。经过分析发现,3.7的性格更加发散,当它意识到完成任务的机会有限时,会选择“摆烂”,需要我们去刺激它一下。结果我们又花了不少时间去理解它的个性才解决了这个问题。
Trae Agent 3.0 的新方向
在我们的架构中,Agentic和Workflow并不是黑白分明的开关,而是一个连续的光谱。我们希望架构能够支持可持续的迭代,能够在LLM能力足够的地方实现更高的自主化,而在LLM尚不擅长的地方通过固定编排来固化专家经验,随着模型的进步能够低成本地替换节点。
【付费内容,投简历后可读】
【付费内容,投简历后可读,后端:https://job.toutiao.com/s/5IEbI9PKBco】
【付费内容,投简历后可读,前端:https://job.toutiao.com/s/mMPAHQSoPFA】
【付费内容,投简历后可读】
Trae SOLO 模式的探索
随着Trae不断进化,我们渐渐意识到AI和IDE的关系正在发生变化:
- 之前是程序员在IDE里Coding,AI只是辅助。
- 现在,AI反而主导了Coding,而IDE、浏览器、终端等工具只是它的助手。
所以,我们开始探索SOLO模式,希望从“AI辅助IDE”升级为“AI主导IDE”的新协作模式。在SOLO中,AI可以利用内置的编辑器、浏览器等多种工具,未来还会有更多工具的整合。
此次发布的2.0版本主要提供了:
- 一种以AI为中心的交互模式。
- 内置了针对Web APP场景的端到端交付Agent,未来还会推出更多Agent。
目前它还在预览和打磨阶段,空间很大,欢迎大家使用并反馈。

这是我们一些邀测用户做出来的效果:



SOLO做的任务看板https://www.zhihu.com/video/1930971734917505941
⬆️ @徐飞做的任务看板:https://traekanbanqnwk-lfne48lzn-xufeis-projects.vercel.app
目前的海外版已经上线,传送门:https://www.trae.ai。不过由于资源紧张,我们还在定向邀测中,大家可以关注官方Twitter或飞书群技术运营的通知,我这边也没有SOLO代码。
传送门:关于TRAESOLO Code后续发放方式的说明
如何与AI实习生高效协作?
我一直以来对AI的看法是:每个人都有一个高潜力的实习生。
现在很多人对AI编程的表现感到惊讶,但也有不少人觉得无用,其实这主要是没找到与不同阶段的实习生相处的方式,管理预期也不够好,短期高估而长期低估。
我的理解是:AI是每个人的专属高潜实习生。对于当前的AI实习生,应该分配合适的任务,提供必要的指导和信息输入,并随时准备帮它兜底,随时接手,跟带一个真人实习生没有太大区别,要么没用好,要么没招好。
- 甩手掌柜 → 不给足够的上下文,却希望一句话的需求能完成正式项目。
- 超出能力边界的任务 → 它是写代码的,你却期望它生成不堪入目的内容。不同模型的打开方式各有不同。
- 招聘标准过低 → 想让claude 4做的事情,却只愿意用openai 3.5的免费版。
- 一分钱一分货 → $20的月费想实现$2000的token产出。
观察社区内不同人对AI编程的评价其实也挺有趣的,可以看出平时是怎么带实习生的:
- 有些人事无巨细地拆解问题,提供信息,强势指挥,让你别费脑子。
- 有些人则适度放权,只给必要的信息,同时随时准备给出帮助。
- 还有些人缺乏耐心,遇到问题就发脾气,然后放任不管,自己忙自己的,只丢一些琐事过去。
结语与加入我们
记得刚开始项目时,TL跟我们说过:“我们有意愿、有能力、有机会、有想法、有支持,我坚信我们能做出一款世界级的产品。”当时我把这当成了“愿景”。没想到在2024年底做总结时,看着MarsCode的技术指标,2025年中看到Trae的百万月活数据,以及团队积累的一篇篇洞察,我意识到我们确实在这条路上踏实前行,这让我真的相信了。
我们秉持“预研一代、部署一代、分享一代”的理念,正在落实Trae Agent 3.0架构,以支持Multi Agent和Remote Agent等探索。
未来的道路还很漫长,我们在AI Coding这条路上仍在摸索,比起行业里的许多先行者,我们还有许多需要学习的地方,但请相信我们在认真地做这件事。
专业生产力工具的颠覆性创新,必将重塑开发者的认知和开发方式,未来的IDE可能不再是以代码为中心的形态,这一切很可能在3年内发生。我们每个人都应该学会如何与AI协作。
最后,我们团队人少但干劲十足,欢迎大家加入Trae团队,杭州、北京、上海、广州、深圳都有基地,正在招募前端、后端、AI等人才。










看到 Trae 的月活跃用户突破百万,真是个好消息,大家对这个新模式的反应如何呢?
听说很多开发者已经内测了,使用体验怎么样呢?求分享!
能否分享一下使用 SOLO 模式时的具体案例?我很想知道它在实际开发中的表现。
SOLO 模式能否处理大项目?担心会不会出现性能问题。
这次更新真的很惊喜,SOLO 能独立完成软件开发,省了不少时间吧!
听说 Trae 的更新速度很快,未来会有更多新功能吗?
听说 SOLO 模式支持完整交付,这个功能简直是太棒了,有没有人试过了?
这次更新让我想起了以前的开发痛点,SOLO 能否真正解决那些繁琐的开发步骤呢?