
这次引发讨论的是Pietro Schirano,他曾是Anthropic的成员,现在是MagicPath的CEO。他直接说自己几乎不再手动写目标,而是让Codex来给他准备一份,再为每个子智能体各自写一份。任务的拆分、并行和检查等都由AI来安排,人类只需给出一句大致的意图就行。
听起来确实很高大上,像是“我只负责战略,执行交给机器”一样,但其实不那么美好。说到底,这是将开发流程中最昂贵的部分,从“写代码”上升到“定义问题”,而现在连定义问题也开始由模型来接手。程序员的角色从最初的工人变成了监工,未来甚至连监工的工作也可能被系统自动替代。

别被那些华丽的演示所迷惑,Codex的这个/goals功能,实际上并不是让AI变得更聪明,而是让AI像个自我循环的工地包工头,规划、执行、测试后再复查,直到任务完成,或者算力耗尽,或者人类忍无可忍叫停。看上去很自动化,但每一步都在消耗算力和金钱。
官方一方面说得轻松,什么目标必须具体到能判断是否完成,不要写“优化一下”这种废话,听着像是在教人怎么提需求,实际上是在把责任推给用户。意思很简单,不要用模糊的语言糊弄我,出了问题别怪模型,怪你自己没写清楚。这正是平台最喜欢的套路,把风险转化为使用门槛。

更有趣的是,这种“让AI自己给自己下任务”的玩法并不是凭空而来的,而是整个编程智能体行业朝着同一个方向发展。Anthropic、Cursor、Codex等公司陆续加入,都在做类似的事情,区别在于有些只允许一层授权,有些则完全放手让AI并行运作。表面上看似在拼产品,实际上是在争夺用户的决策权。
如果你能想明白这一点,就会发现这并不是在帮程序员省时间,反而是在重新定义谁才是“真正的劳动者”。以前是你写需求,AI写代码,现在你连需求都不需要写,AI先把需求翻译成可执行的动作,再切分成子任务,最后自己验收。就好比你去餐厅点菜,结果厨师、服务员、收银员全是机器人,而你只需要说“来个能吃的”。

听上去很不错,对吧?但实际上问题并不简单。代码的世界可不是流水线上的螺丝钉,需求本身经常模糊不清,业务逻辑也在不断变化。今天看似简单的bug,明天可能就会引发一连串的历史问题。AI虽然能减少一些重复工作,但很可能会把“看起来对”的东西当成“真的对”,最后产出一堆能运行但不符合业务逻辑的成果。
这就是问题的根本逻辑,所谓的“AI自己拆任务”,并不是模型突然变得聪明,而是上游将大量重复劳动标准化,模型才有机会假装自己很能干。别忘了,模型本质上仍然是个超级复读机,它的强大之处并不是创造新事物,而是将已有材料重新组合得像样。真正的脑力工作,还是得人来完成。

说到这里,我们得看看账本。18小时完成14个功能,只花4.2美元,这样的数据一出来,评论区立刻热闹了,很多人认为这是开发模式的革命,实际上更像是现场的烟花,表面亮丽,背后却有一整套看不见的成本:测试环境是谁建立的,基础代码是谁写的,需求又是谁定义的,失败的尝试又烧了多少token,这些都没算在内,才是真正的开销。
而且,token看似便宜,但一旦放开使用,真的是个烧钱的机器。Andrew Chen在做一个eGPU驱动项目时,14小时后还在推进,token的使用量直接暴涨了一万倍。这就像你平时用打火机点两下,看似不费力,真让你用火焰喷枪连续烧半天,油箱立马见底。AI智能体也是如此,运行时间越长,花费越是像水一样流失。
所以,你看企业并不是为了“解放程序员”才引入这些技术,资本的算盘其实很简单,几美元就能解决原本需要几个人、几天甚至几周的工作,谁能不心动?特别是在软件行业,老板更关注的不是“代码质量”,而是“人力成本下降”。只要机器能干60%的活,老板就敢裁掉30%的员工,剩下的10%拿去做demo。
这背后还有一个现实的商业动机,就是平台希望把开发者从“使用者”转变为“喂养者”。你越依赖它来自动拆分任务,它就越能掌握你的工作流、项目结构、代码风格和历史决策,这些都成为了它下一次生成的“燃料”。最终,它不仅卖你工具,还在卖你工作习惯,这比单纯卖个IDE要贵得多。
别再谈什么智能未来,谁掌握了任务定义,谁就掌握了生产节奏,谁控制了节奏,谁就能收取“租金”。这套把戏历史上并不新鲜,云服务商当年也是先说“帮你省运维”,然后把你绑进自家的生态,数据库、存储、监控、部署一条龙锁死,你想离开都难。而现在的AI智能体不过是把这套老办法换了个新外衣罢了。
如果你觉得这像是技术升级,那就太天真了。很多所谓的“自动化”,实际上只是将人工转移到更隐蔽的地方。过去程序员在IDE中手动敲代码,现在变成在提示框内雕刻需求。表面上少写了几行代码,实际上却增加了十倍的约束、验收、回滚和边界描述,最终还是得人为兜底。区别只在于,脏活从明面上转到了暗地里。
就像很多互联网公司当年宣传所谓的“零工经济”,实际上是把雇佣关系拆得支离破碎,风险丢给个人。而现在这波AI编程也是同样的道理,表面上看是智能体替你工作,实际上却是将你从执行层推向审查层。最累的不是编程,而是监督;最贵的不是产出,而是判断。一旦判断权被模型夺走,人类只能坐在那里点头。
再看看这些产品的宣传语,几乎都在暗示一个趋势,未来的开发不是“人写机器看”,而是“机器写机器看”,人只需给个方向。方向给完后,AI自动拆分、并行、汇总、复盘。听上去很像效率工具,实际上更像一个正在自我强化的工厂系统,今天帮你节省时间,明天就告诉你,其实你的这份工作也可以省掉。
这种把戏,科技圈早就玩腻了。乐视当年也是如此,PPT吹得飞起,生态、闭环、未来入口一套接一套,结果一旦现金流断裂,连讲故事的人都跑了。暴风影音也是一样,靠着早期的红利过日子,等商业模型撑不住时,崩得比谁都快。这些公司在倒下之前,都有一个共同特征,就是特别喜欢把短期的demo当作长期能力。
再往前看,2010年前后的云计算、移动互联网、O2O风口,同样的味道。先用一个概念让你觉得未来已经到来,再用一串看似漂亮的指标把你迷惑。最后真正赚钱的,不是台上讲故事的人,而是那些卖设备、卖芯片、卖带宽、卖云资源、卖流量的人。风口从来不属于普通用户,而是那些卖铲子的人。
现在的AI编程也逃不出这个规律,模型厂商赚的是算力,云服务商赚的是调用,工具厂商赚的是订阅,企业客户购买的是“可能会省人”,而真正承担不确定性的,仍然是一线开发者和被拿去做实验的项目。项目成功了,老板说这是AI的功劳;项目失败了,责任永远归于人没把提示写清楚。
还有一种更隐秘的情况,很多人可能没注意到,这种智能体系统特别容易让团队产生错觉,以为自己在大幅提高效率,实际上只是把试错成本转嫁给了模型和云账单。短期内看似人少了,长期看项目复杂度并没有降低,甚至因为多了一层模型中转,调试变得更加困难,责任变得模糊,谁都无法清楚到底是业务出错了,还是智能体理解错误了。
这和当年的自动驾驶特别相似,车企一开始就吹“辅助驾驶”,消费者一听兴奋,以为离无人驾驶不远了,结果一旦出事,责任边界一片混乱。AI编程也是如此,表面上是帮助你自动拆任务,真出问题时,谁来负责?模型不会签字,平台不会承担后果,最终还是开发者自己收拾残局。
所以,尽管现在大家对“AI自己写目标”感到热血沸腾,但过一段时间你会发现,这玩意儿最大的价值,不是让程序员彻底解放,而是让部分低端的重复劳动更快被取代,让那些懂得如何管理项目、验收结果、评估风险的人更值钱,而那些仅仅会照着工单敲键盘的人终究会被逼到墙角。
归根结底,这场看似炫酷的变革,真正改变的不是软件开发本身,而是软件开发里的权力分配。过去是人指挥机器,现在是机器帮助人做决定;再往后,人负责签字,机器负责流程。听起来像提升效率,实际上更像是一场缓慢而稳定的去人化,最先失去存在感的,往往不是那些高管,而是以为自己很专业,实际上只是机械执行的人。
因此,我一直认为,面对这些新闻,别急着喊颠覆,更不要立刻鼓掌。你得先问一句,这到底是为谁省了时间,谁放大了利润,又把谁的工作变成了可替代的标准件?答案往往并不美好,技术并没有那么高尚,商业也不会讲情怀。今天你觉得自己在使用AI,明天可能就会发现,是AI在重新定义你的价值。












我觉得AI再强大,最终还是得有人来把控结果,不然后果不堪设想。
程序员的角色真的在变化吗?如果AI能自己定义需求,未来我们还需要程序员吗?
未来的程序员可能变成监工,真让人担心,这样的发展方向是不是太危险了?
Codex这玩意儿太神奇了,居然能自己写目标,效率大幅提升!
这种方式确实让人感到惊讶,AI居然能自己拆分任务,未来的开发流程会不会变得更复杂?
听说过的AI能写代码,没想到连需求都能自我生成,真神奇。
如果AI负责拆分任务,那最终的代码质量由谁来保障呢?
光靠AI生成的目标,真的能保证质量吗?感觉这风险有点大。