「我几乎不再亲自写/goal了。」
最近,前Anthropic的成员、现在MagicPath的CEO Pietro Schirano在X上发了这句话,评论区立马热闹起来。

他的做法是:不再手动写/goal,而是让Codex为自己生成一份,再给每个子智能体(agent)也写一份。
简单来说,就是把一个大致的意图交给Codex,让它负责写出详细的/goal——任务怎么分解、哪些可以并行、最后怎样汇总,都由模型来决定。
从头到尾,人类只需在开始时表述自己的意图,后面的任务拆解、调度、总结,全都由模型来搞定。
Pietro这句话可不简单,他这次交给AI的不是体力活,而是判断力:过去开发者让AI处理的是「怎么写」,而现在则是「写什么」。
最开始只需要写一句提示,AI就能完成任务。
后来甚至连提示都懒得细写,只给出一个模糊的目标,剩下的步骤让它自己去琢磨。
现在,干脆连「目标」都省略了。
有位网友在评论区感叹:
我们似乎已经进入这样的时代:我给AI一个目标,AI反而把这个目标调整得更完美,然后我就可以假装自己一直是那个项目经理。
这句话正好点出了这次变革的核心。
当程序员连「要做什么」都不再亲自写的时候,他在这条流水线上的角色到底是什么呢?

人只需给出意图
任务让agent去处理
过去几年,提示词工程被视为AI时代的一项重要技能。会写提示词就像掌握了操控模型的钥匙。
接下来是元提示(meta-prompting):不是直接写指令,而是让模型帮助你优化指令。
现在Codex展示的更进一步:自生成目标(self-goal generation)。模型不再只是把你的话润色,而是直接接管了「目标」的概念:你给意图,它负责写/goal。
这一切的基础是Codex在今年4月底推出的/goal功能,最初出现在Codex CLI中,最近只需在config.toml中开启features.goals就能使用。
官方把这个功能放在Codex CLI的0.128.0版本里,默认是关闭状态,需要手动修改配置文件来开启。
开发者圈给这个功能起了个外号叫「Ralph循环」:规划、执行、测试、复查、迭代,循环不停,直到达成目标。
它和普通的对话提示词最大不同之处在于,goal这段内容同时扮演两种角色:起始指令和「完成审计」。
Codex每完成一轮任务,都会回头检查目标,问自己两件事:还需要做什么,是否已经完成。这样一轮接一轮,直到任务完成、被你终止,或者达到token的上限。
因此,官方反复强调一个原则:目标必须写得足够清晰,让Codex能判断「是否完成」,要避免使用模糊的词汇,比如「优化一下」「完善一下」。
真正给这项工作定调的,是OpenAI的Codex负责人Tibo(Thibault Sottiaux)。

他在X上表示,我们创造的每一款工具,都是为了智能体使用的:
Codex不仅能查看自己的/goal,还能设定它。这是元提示的进一步拓展,用一句话来说就是:人给出意图,智能体来生成任务。
开发者@MikelEcheve进一步解释了这项能力:Codex能够自主构建/goal,为多个并行的智能体生成目标,并自主分配工作。

Codex自述:「因为你明确要求并行智能体,我就使用了多智能体工具」,并已经「创建了一个agent」,右侧的子智能体面板中出现了首个分身Gibbs。图源:Pietro Schirano @skirano演示视频

有人已经使用它工作了整整18个小时
说到/goal的自转能力,已经有人用真实项目来验证了哦。
有个开发者尝试了一下:他给Codex下达了一个高层次的目标,要它把BACKLOG.md里的18个功能全部完成,然后他就离开了。
差不多18小时后回来一看,Codex已经自己实现了14个功能,而且每个改动都通过了测试,还在CI里合并了,整个过程没有求助于人工审核,连代码审查也交给了GPT的子智能体。
算下来,这次操作大约花费了4.20美元。
而skirano展示的更厉害:他不止是让Codex执行一个目标,而是让它为自己和每个子智能体分别写一个目标,这样智能体的层级就自然形成了。
只给Codex一句话,它就能把所有事情处理得妥妥的。

运行大约10秒后,状态变成了「Creating 2 agents」,右侧的子智能体已经扩展为Gibbs和Leibniz两个并行分身。图源:Pietro Schirano @skirano演示视频

主智能体「Created 3 agents」,右侧的Gibbs正在执行它自己的目标:设计一条数学化的过山车轨道。每个智能体都有各自的目标,这正是这套方法的精髓。图源:Pietro Schirano @skirano演示视频
这种方法正在逐渐被标准化。
开发者Pablo Stanley已经把它变成了一个模板,给出了一套「Build [THING]+功能+风格」的提示框架,指引Codex自动生成目标,再孵化出相应的子智能体。整个流程中,人只需要负责开头那一句话。这个模板还得到了skirano的认可。
在Reddit的r/codex社区里,开发者们已经用/goal做了很多事情,比如长期任务的对齐、自动生成验收标准,甚至规避死循环。
还有一位开发者RTK(@riverkhan)走得更远。OpenAI团队最近发了一篇关于如何有效利用/goal的文章,他直接把文章里的最佳实践封装成了一个开源技能,取名为Infinite Skills,结构模仿Superpowers,每个技能对应skills目录下的一份SKILL.md。
里头有一个叫goal的技能,特别有意思:在你正式启动/goal之前,它会先「面试」你,把一个模糊的目标细化成具体、可验证的契约,然后再把整理好的完整目标输入到goal模式中。

https://github.com/Infinite-Labs-AI/infinite-skills
换句话说,goal模式的效果好不好,关键在于目标是否写得够具体,以及Codex能否自己判断任务是否完成。
现在连「把目标弄清楚」这一步,都有人做成工具来帮你搞定了。

三家公司都在做同一件事情
这股潮流可不是Codex独自引领的。
几乎是在同一时间,三家主流的编程智能体都推出了「让AI自己拆解任务、自己派智能体」的功能。
比如,Anthropic的多智能体编排在5月6日上线,Cursor的/orchestrate紧接着在5月7日跟上。
回到4月底,Codex早就为/goal的自主管理打下了基础。
三家公司的动作几乎是同步的,但方向却出奇地一致。
社区里也有网友把这些功能与Claude Code的CLAUDE.md进行了比较:同样是让智能体阅读「给自己看的说明」,然后根据这些说明行动。
因此,这更像是一个跨产品的共性趋势,而不是某个公司的独特功能。
有趣的是,细节上的取舍。
Claude的协调者最多能派出20个子智能体,而且特意限制只派一层:如果深度超过1,它就会直接忽略掉。
这与Codex那种放手让其并行派生的方式,形成了鲜明的对比。
这背后其实隐藏着更深的逻辑。
当Codex能够为自己和一群子智能体分配任务时,它就不仅仅是个代码助手,更像是一个在后台运行的任务调度器,写代码只是它顺手能做的事而已。
OpenAI显然希望智能体能自己设定任务,目标肯定比「帮助人写代码」要大得多。

小心token账单飙升
自己设定目标、自己分配智能体,听起来挺不错的,但这也可能让你的token费用飙到天上去。
任务运行时间越长、越不需要人监控,token的消耗就越大。
a16z的Andrew Chen,利用/goal在一个真实的eGPU和Mac设备驱动项目上连续工作了整整一夜。这可不是简单的演示,而是真正的实战,经过14个小时,第二天早上它还在继续进行。
他坦言,这样的使用方式会让token消耗激增到原来的十倍。

如果你手动提问20次、每次都盯着,最多也就是几十万token;而一个无人看管的会话运行14小时,消耗的量可就不是一个级别了。
甚至连官方都在提醒大家要小心:建议在goal的最后加上token预算,别一开始就发/goal,先把项目跑出个雏形再说。

目标可能会偏离
智能体可能会偷懒
虽然热闹,但社区讨论中充满了质疑的声音:
让AI自己设定目标,会不会导致目标偏离,跑着跑着就走样了呢?
智能体会不会选择轻松的捷径来走呢?
这套系统,究竟能不能真正应用于生产环境呢?
在Reddit的r/codex讨论区,大家依然把/goal主要用于长任务的对齐、生成验收标准和避免死循环:本质上,还是需要人持续关注的状态。
网友nick调侃说,再让它递归几层,Codex可能就要转变为把我们推到旁观者的角色。
Claude的「只派一层」限制也表明,今天的所谓自治,其实更像是带有保护措施的放权,距离真正的自治多智能体系统还有很长的路要走。
不过,真实的变革正在进行中,人们的角色正在逐步后移:最初是不写代码,接着是不写任务,现在只剩下简单的一句话。
当Codex、Cursor、Claude等将「定义任务」也交给模型后,新的问题来了:当代码、任务、意图一步步交出去后,程序员该如何重新定义自己的角色呢?











这个功能真是太神奇了,感觉未来编程会变得更轻松。
AI可以自给自足,未来程序员可能会变成项目经理,角色转变值得关注。
对于AI自生成目标的过程,是否存在一些潜在的风险,比如目标不够准确?
这样下去程序员的未来会不会被AI彻底取代?有点担心。
如果程序员的任务被AI取代,未来的工作会不会变得无聊?这让我有些担心。
这让我想起了自动驾驶汽车,AI的能力在不断提升,未来会不会变成‘程序员’这个职业的自动化?
这就像AI在当项目经理,程序员成了打杂的?未来会不会变成一堆人盯着AI工作?
这就像把自己的工作外包给了AI,未来的程序员是不是要学会怎么管理AI?
如果Codex能够完全接管目标设定,那程序员的价值究竟在哪里?这是在解放人力还是在削弱人类的能力?