
新智元报道
编辑:桃子 好困
【新智元导读】太酷了!在Claude 5即将到来之际,OpenAI突然发布了一个超级强大的工具——Codex。这款工具可以让你同时管理多个智能体,开启编码的自动化新纪元。
Claude 5的到来似乎在酝酿着什么,OpenAI终于按捺不住了。
就在刚才,OpenAI毫无预警地推出了一个重磅产品——Codex正式成为独立桌面应用。


这可不仅仅是一个写代码的地方,更像是一个可以同时调动多个智能体的「超级指挥室」。

Codex的目标非常清晰:成为智能体的「指挥官」。
具体来说,Codex能够做到以下几点:
比如说,你想给相册的照片加个「拖拽」功能,只需选择「工作树」,AI就能在同一个环境中分工合作。

Codex的升级让人惊叹,它不仅会生成代码,还能够利用这些代码作为「技能」来操作电脑。
例如,想要处理项目中的评论,直接调用已有的技能,Codex便能迅速解决问题。

更让人惊讶的是,OpenAI用一句简单的指令,让Codex消耗700万token,轻松制作出一个3D赛车游戏。

这次Codex的推出,绝对不是旧瓶装新酒,更不是一次肤浅的包装。
它标志着AI编程从「助手」正式升级为「指挥中心」。
奥特曼激动地说,「真是太棒了,简直超出我的期待!」

「AI程序员不会感到疲惫,也不容易沮丧。他们会一直努力,直到把问题解决。」

OpenAI总裁Greg强烈推荐——
多年来我一直是终端和Emacs的忠实用户,但自从使用Codex后,再回到终端简直像是回到了过去,差距实在太明显。
这就像是为开发者量身打造的AI智能界面。

OpenAI Codex代表了全新的AI编程模式,可能会彻底改变开发者与代码之间的互动方式。
甚至,Codex还能与Claude Cowork配合,瞬间整理凌乱的桌面。

目前,Codex已经在macOS上正式推出,Windows版本也在筹备中。
OpenAI还推出了「限时福利」,ChatGPT的免费用户以及Go版本也可以体验Codex,Plus、Pro、Business、Enterprise和Edu计划用户的速度将翻倍。
编码神器Codex APP震撼来袭
一个人就能指挥所有智能体
macOS上的Codex应用是一个功能强大的新界面。
它可以帮助开发者轻松管理多个AI智能体,并行处理任务,与AI一起高效完成那些复杂的工作。
过去,开发者和AI的合作方式是「你写一段,我接着写」。

如今,Codex的问世将彻底改变软件开发的方式——
人类不再与AI紧密配合,而是可以直接给AI分配任务,贯穿整个软件设计、开发、发布和维护的过程。
这一变化的迹象,其实在2025年4月Codex发布时就已经开始显现。
开发者与AI的协作方式已经发生了根本性的变化。
AI智能体的时代来临,软件开发变革进行时
现在的技术真是飞速发展,现有的模型已经可以一气呵成地处理那些复杂的长流程任务。开发者们也开始在不同项目之间调动多个AI智能体,简单地把工作分派出去,让它们并行处理这些耗时的重大项目,真是省时省力。
如今的核心问题不再是AI到底能做些什么,而是我们如何能够有效地指挥、监督这些智能体,甚至与它们合作。可惜的是,现有的IDE和终端工具似乎并没有为这样的需求而设计。
这种新型的构建方式,再加上模型能力的提升,迫切需要一种全新的交互界面。这也是OpenAI推出Codex桌面应用的原因,它被称为“AI智能体的指挥中心”。
多智能体并行,让代码狂飙不混乱
Codex为与多个AI智能体的并行任务专门打造了一个独立的工作空间。
所有的AI智能体都在按项目组织的独立线程中运作,这样你就能顺畅地在不同任务之间切换,完全不必担心上下文的丢失。
在应用中,你可以直接查看AI的修改,甚至在差异对比中留言,或用编辑器进行手动调整。
另外,它还支持Git worktree,这样多个AI就能在同一个代码仓库里独立工作,互不干扰。
每个AI都在你代码的一个隔离副本上操作,这让你可以尝试不同的开发路径,而不用担心会影响到主代码库。

当AI智能体在忙活时,你可以把修改拉到本地,或者继续让它推进,完全不影响本地的git状态。
应用还会自动同步Codex CLI和IDE扩展中的会话历史和配置,这样你就能迅速在现有项目中使用它。
解锁Skills外挂,轻松打造3D赛车游戏
Codex正在逐步从一个单纯的代码生成AI,转变为一个能够运用代码真正解决问题的AI。
通过Skills(技能),Codex的能力可以轻松扩展。
未来,Codex的功能将不仅仅局限于生成代码,它还可以处理信息收集、整合、问题解决、写作等多种任务。
这些Skills就像是预先打包好的指令、资源和脚本,能帮助Codex高效连接工具,运行工作流,并根据团队的习惯完成任务。
Codex应用内设有一个专门的界面,用于创建和管理这些Skills。
你可以直接要求Codex使用某个特定的Skill,或者让它自动根据当前任务进行调用。
OpenAI给我们举了个例子,曾经让Codex开发一个赛车游戏——
游戏里要有不同的车手、八张地图,甚至玩家还能用空格键触发道具。
借助图像生成Skill(由GPT Image驱动)和网页游戏开发Skill,Codex仅凭一个用户提示词,就独立工作,耗费了超过700万个Token,成功打造了这款游戏。
它不仅是设计师、游戏开发者,还充当了QA测试员,通过实际试玩来验证成果。
可以看到,在使用了6万token的版本中,画面显得非常粗糙。
狭窄的赛道中间挤满了碰撞后会穿模的“障碍物”。
技能箱可以吃,也可以发射,但似乎没什么实际效果。
最尴尬的是,玩家会在“第二圈”无限循环……
而在80万token的版本中,画面看起来稍微好了一些,赛道也宽敞了不少,接近我们平时玩的赛车游戏了。
不过,技能箱吃到的技能似乎依然没什么用,发射出去后车子们还是各自为政……
而且依旧会在第二圈陷入循环,永远跑不完。
最后这个700万token的版本,画质明显提升。不仅赛道清晰,技能箱也更精致了。
这次,技能箱真的有用。
比赛刚开始,我们就吃到了AI扔出的一个大招,结果没能躲开,喜提倒数第一。
不过,比起前两个版本的无限循环,这次至少能完成比赛了。
从对模型训练的评测,到起草文档和汇报实验数据,OpenAI内部构建了数百个Skills,帮助多个团队自信地把以前难以定义的工作委派给Codex。
Codex应用内置了一个Skills库,覆盖了OpenAI内部常用的工具和工作流,下面我来重点介绍几个。

使用Vercel和图像生成Skills更新网站

使用电子表格Skill生成购物清单
使用Linear管理你的Issue Backlog
当你在应用中创建一个新Skill时,Codex可以在你工作的任何地方使用它:应用内、CLI或IDE扩展中。
你也可以把这些Skills提交到代码仓库,让整个团队都能共享使用。

OpenAI分享的Agent Skills可以在这里找到:https://github.com/openai/skills
一键自动化,全天候为你服务
用Codex轻松搞定自动化任务
Codex真的很厉害,可以帮你设置自动化,按计划在后台自动完成各种工作。
这些自动化功能可以把指令和可选的技能结合起来,按照你设定的时间表来运行。
一旦自动化完成,结果会被放到审查队列里,你随时都能回头看看,然后根据需要继续后面的工作。

设置自动化来定期创建新技能
在OpenAI,团队一直利用自动化来处理那些重复又重要的任务,比如每天分类问题、查找CI失败的原因、生成日报、检查Bug等等。
双人格模式,随心切换
开发者在和AI合作时,风格各有不同。
有些人喜欢直接、只讲求结果的搭档,而另一些人则更偏爱多交流、互动感强的风格。
现在,Codex让开发者可以在两种个性之间选择:一种是简洁实用型,另一种则是更具沟通感和同理心的风格。
这两种风格的功能是一模一样的,完全是为了迎合你的喜好。只要在应用、CLI和IDE扩展里输入/personality命令,就能轻松切换。

安全第一,按需配置
另外,OpenAI把“设计即安全”的理念融入了CodexAI智能体的各个方面。
Codex应用采用了原生、开源且可配置的系统级沙箱,这就像在Codex CLI里一样。
默认情况下,CodexAI智能体只能编辑它当前所在的文件夹或分支的文件,并使用缓存的网页搜索。
如果你想运行一些需要更高权限的命令,比如联网访问,Codex会先征求你的许可。
你还可以为团队或项目设置规则,允许特定命令自动以更高权限运行。
一切都能用代码掌控
如今,很多企业和开发者越来越依赖Codex来进行端到端的开发。
自从12月中旬发布了GPT-5.2-Codex以来,Codex的使用量翻了一番,过去一个月有超过100万的开发者在使用它。
接下来,团队计划继续拓展Codex的使用场景,包括推出Windows版应用、不断提升模型的能力,以及加快推理速度。

OpenAI的科学家们感慨,最近几周写的代码比过去几年还要多,甚至用Codex修复了Prism的多个Bug和功能更新。
在应用内部,OpenAI还会根据实际反馈不断完善多AI智能体的工作流程,让管理并行任务以及在AI之间切换变得更加简单,且不丢失上下文。
他们还在为自动化开发云端触发器支持,这样Codex就能在后台持续运行,而不只是在你电脑开着的时候。
Codex的核心理念就是:一切都由代码控制。
一个AI智能体在推理和生成代码方面越强,它在各种技术和知识工作中的能力也就越强。

OpenAI的全家桶
不过,当前一个重要的挑战是,前沿模型的能力和用户在实际操作中使用它们的便捷性之间有差距。
Codex的目标就是缩小这个差距,让人们更轻松地指挥、监督并将OpenAI的模型智慧应用到实际工作中。
OpenAI致力于将Codex打造成为最强的编程AI智能体,这也为它未来处理代码以外的广泛知识工作打下了基础。
附录
在制作这款赛车游戏时,Codex使用的初始提示词如下(总结版):
利用Three.js实现Voxel Velocity,作为一个3D体素卡丁车游戏,只有单人模式:1个人类对7个CPU,总是3圈,所有8条赛道在这个模式下都可用,没有进度限制。构建一个最小的赛前流程,包括赛道(8)、角色(8)、难度(轻松/标准/刻薄)、可选的镜像模式、允许克隆和开始比赛的选项,加上一个选项菜单和一个暂停菜单(恢复/重新开始/退出)。创建一个街机驾驶模型,具备灵敏的操控和友好的碰撞检测,漂移作为主要技能,并有漂移充电系统,精确控制加速等级(1级0.7秒,2级1.1秒,3级1.5秒),并保持基准速度「快但可读」,在宽阔的道路上保持持续的超车。实现8个道具,单道具容量,微妙的位置加权分布,和温和的效果(最大失控≤1.2秒,最大转向禁用≤0.6秒),创造混乱而不晕眩,同时加速时减少50%的越野减速。定义8个角色及其统计数据和AI倾向,实现CPU难度预设和赛道编写的赛车/变化样条线,漂移区和危险回避,以便AI能够干净地超车,并发布HUD/音频元素(位置,圈数/最后一圈横幅,小地图,道具槽,计时器/分段,可读的音效,和每条赛道一个音乐循环)。
之后,Codex会不断从10个通用提示词的随机列表中被提示,以继续处理这个问题。
其中一个提示词的例子是:
你的任务是添加新功能,使游戏更接近原作。首先,玩一下游戏,找出与原作相比缺少了什么。然后挑选几个缺失的功能并实现它们。每添加一个功能后,都要彻底测试,确保它正常工作。如果你在玩的时候发现任何错误,也要优先修复。
参考资料:
https://x.com/sama/status/2018414858015039504?s=20
https://x.com/OpenAI/status/2018385565289267236?s=20
抱歉,我无法访问外部链接。请提供具体内容,我将很乐意为您改写。












听说Codex能做3D赛车游戏,真是太夸张了,我也想试试我的游戏创意!
这个工具是不是能彻底改变我们写代码的方式?太神奇了吧!
看到Codex的功能,真想立刻体验一把!有没有人试过?效果真的如文章所说那么惊艳吗?
AI程序员不怕沮丧?希望它能够真的是这样,减少我的加班!
使用Codex后,开发者是否还需要深入理解代码的逻辑?这样会不会影响学习编程的深度?
期待Windows版本的上线,希望它能带来同样的便捷和高效。
在使用Codex时,建议定期检查生成代码的逻辑,以避免潜在错误。
感觉Codex就像是开发者的超级助手,这种转变对我们来说是好是坏?
用Codex开发3D赛车游戏的案例让人惊叹,我们是否能看到更多这样的创意?
听说Codex能处理复杂任务,真的能帮我们节省多少时间?
看到Codex的应用场景,真心希望这个工具能帮助我提升工作效率,谁来分享一下使用心得?
我在使用Codex时,发现它的智能分工真是高效,简直像是拥有了一个得力助手!