本文来源于微信公众号:王智远,作者:王智远,图片来自:AI生成
从昨晚到今天早上,我的手机就像被按了“疯狂模式”,朋友圈和新闻推送都在刷一个名字:GPT-5。
仔细想想,这次的升级主要有三个亮点:
1. 架构大变样。它不再是单一模型,而是一个可以调度多个模型的“智能体生态”,能根据不同任务的类型和复杂度,自动选择最合适的处理方式。
2. 代码生成能力大幅提升。很多人称它为“vibe coding”,只需用自然语言描述需求,它就能生成一个可运行的应用。
3. 工具调用和自主合作能力更强。它能拆分复杂任务,甚至在发现问题时自己去创建工具解决。
说白了,去掉光环和神秘感后,实际上就这三点。
一
相比这些功能,我更想问问:GPT-5究竟是一次真正的技术飞跃,还是个精心包装的技术更新呢?
直接说我的看法,它确实有技术上的提升,但“飞跃”这个词要小心使用。因为飞跃不仅仅是性能的提升,还意味着底层架构的彻底改变。就像从功能机升级到智能机,从马车变成汽车。
那么这次的改动是什么呢?从架构上来看,GPT-5引入了一个叫“动态路由器”的东西。
这个概念很有趣,以前是一个万能模型在处理所有问题,现在它会先分析问题的类型、复杂程度和意图,然后分配给不同的专用模型进行处理。
举个例子,你问它一个简单的问题(比如查资料或翻译句子),它会用主模型 GPT-5,响应速度快;如果是复杂推理(如科研计算或法律推演),它会调用深度思考模型 GPT-5-thinking,推理链更长、准确性高;甚至如果你的使用额度用完了,它还会自动切换到轻量版 GPT-5-mini,确保服务不中断。
简单来说,这就是一个轻量级的代理框架:你给它任务,它先分类,再分配,最后将结果汇总给你。
那么这种多模型协作的本质是什么呢?
表面上看,它像一支各司其职的团队,兼顾效率和准确性;但从技术源头来说,这种思路其实并不新鲜。
Anthropic早就有类似的模型切换,根据不同任务的推理深度来应对不同需求;谷歌DeepMind的某些研究中,也出现过根据任务复杂度动态调用不同专家模型的方案;
开源界的DeepSeek MoE架构也类似,只是它将多模型协作隐藏在后台,复杂问题调用多个专家,简单问题调用少数专家,节省资源。
GPT-5的妙处在于,它将这种合作做成了开箱即用的体验,用户无须思考“我该用哪个模型”,系统会自动为你选择。这就是OpenAI在商业化上的一个杀手锏,把原本只有研究人员和开发者才能使用的“多专家模式”,变成了普通人也能直接使用的功能。
所以我认为,从技术角度来看,这次是架构优化加体验升级,而不是底层的技术革命;在商业上,它是一种巧妙的产品化,将技术巧妙隐藏,让协同成为默认的生态。
二
在整个发布会中,有一个最直观、最容易让人感受到的能力就是写代码。听起来很炸,现场也非常热闹。那么,它究竟是生产力的革命,还是程序员的梦魇呢?
我更倾向于认为,这是一场效率革命。只需用普通话、英语,甚至混合几种语言清晰描述功能,它就能直接生成可运行的软件。
举个例子:帮我做一个法语学习网站,要有单词卡片、语音小游戏,还有贪吃蛇的改版。三分钟内,它就能给你生成240行代码,UI风格也一并搭配好了。
在官方测试中,GPT-5在SWE-bench这种代码基准测试中的编码准确率为74.9%(而GPT-4只有67.6%),通过率提升了22%。
这不仅意味着代码写得对,而且速度也快,从按天计费变成按分钟生产,仿佛把一个资深全栈工程师装进了电脑里。
这样的能力会带来三重冲击:
对中小企业的老板来说,是个大福利。开发成本直线下降,原型验证的周期从按周变成几分钟,创业公司能够更快地测试市场,减少失败的成本。
对程序员而言,初级开发职位面临直接替代;中高级开发将转向代码审计、安全检查、性能优化,或者做“AI协作管理”,而不是亲自编写每一行代码。
对于低代码平台,这可能是个生死考验。过去需要拖拽组件和配置表单,现在在一个聊天窗口里说几句话就能完成。“描述即应用”比“拖拽拼装”更直接、更高效,这将压缩低代码平台的生存空间。
当然,这一切也不是没有代价。
官方的GPT-5 API价格是:主模型输入每百万token 1.25美元,输出10美元;Mini版本输入0.25美元、输出2美元;Nano版本最便宜,输入0.05美元、输出0.40美元。
虽然价格表看起来简单,但实际使用起来没那么直观。
推理能力越强,模型在后台“思考”所消耗的隐形token就越多,这些token你可能看不见,但账单却会蹭蹭上涨。
而且,国内早已出现类似的“说话写代码”工具,比如百度的“文心快码”、腾讯云CloudBase在6月发布的AI Builder、字节的TRAE……
区别在于,他们将写代码单独做成一个产品,而GPT-5则将这项能力直接嵌入AI“核心”,一个聊天窗口几乎可以涵盖开发、接口、逻辑和UI,体验也统一。
所以,有三个问题必须思考:
1. 虽然API价格明确,但让AI“仔细思考”的成本可能远超预期,使用越多、费用是否会不断增加?
2. 国内这些工具未来是否会效仿GPT-5,将所有能力打包成“全能代理”?
3. 代码生成速度快,但真能保证安全和可维护性吗?毕竟在真实的业务场景中,谁也不会天天开发大型应用,大多数时候是临时制作统计表、搭建审批流程,或者开发协同工具,这才是低代码平台的日常战场。
三
写代码只是冰山一角,如果把这些能力整合到一个智能体生态中,行业格局将大不相同。
为什么呢?因为在商业竞争中,单一能力只能解决局部问题;而平台化的能力,则意味着你能在一个入口下,解决整条业务链的问题。
举个简单的对比:单一AI工具就像请了个外包写手,用完就走;而智能体生态更像签了一个全能秘书,可以查资料、写作、排版,甚至直接帮你发出去。
企业需求永远是闭环,谁能提供闭环,谁就能占据优势。
从数据的角度来看,公版GPT-5虽然强大,但如果把企业自己的历史业务数据、流程数据、客户数据都输入给它,生成的智能体将立即变成“懂行的内行人”。这种效果,中小企业在公版模型中几乎无法实现。
从算力壁垒来看,多模型调度加长推理,对算力的消耗非常大。大型企业有能力自建机房、签长期算力合约,这才是真正的盈利之道。
从用户接触点来看,有现成入口的公司,更容易将智能体生态嵌入到现有产品中。
例如:微软有Office、Teams、Outlook等,天然覆盖了数亿知识工作者;谷歌有Workspace、Gmail、Drive,可以在用户的日常工作流中无缝集成AI;Salesforce则拥有CRM和一整套企业应用,能够将智能体深入销售、客服、运营等环节。
平台化协同:未来的挑战与机遇
这就意味着,AI 平台可以直接嵌入到各个应用中,形成一种自然的分发方式。
简单来说,如果你把一个集合了多种模型的智能代理放进你的业务系统里,它就会变成一个超级智能代理。
在这种趋势下,低代码平台如果不进行转型,可能会被“描述即应用”的方式彻底超越;而传统的 SaaS 只解决流程中的某一个环节,最终也可能被完整的智能体生态所取代。
对于一些中小型 AI 创业公司来说,如果他们的核心价值仅仅是“在 GPT 上做个小工具”,那其实是在为大企业验证功能。
我觉得,这才是 Sam Altman 背后的真正意图。
企业真正需要的不是“使用 AI”,而是“通过 AI 实现业务目标”。如果有公司能在一个平台上,整合入口、账单和 AI,搞定所有流程,那么它不仅会抢走别人的功能,还会占据客户关系和数据。
因此,我认为,真正的变化潜藏在水面之下,平台化协同有可能彻底改变 B 端行业的格局。
四
听起来平台化协同是一个颠覆性的机会,但如果要真正落地,风险也是不小的,尤其是 GPT-5 想要进入 B 端市场,它面临三座大山。
发布会上展示的案例几乎是“完美的条件”:数据干净且格式统一,流程设计明确,没有跨部门的争斗,系统接口也事先打通了。
可是在真实的企业环境中,情况可就大不相同了。Salesforce 推出 Einstein AI 时,就曾公开警告:数据如果不干净,强大的 AI 也可能给出错误甚至误导性的结果。
在现实中,智能体协作必须面对各种各样的 ERP 系统、老旧的数据库、非标准的 API,甚至是人为设置的流程障碍。
换句话说,我认为,GPT-5 在发布会上所说的“秒级响应”,一旦进入企业,可能就变成了十几分钟才能完成,体验差异可不是小事。
另外,智能体生态的好处是形成闭环,但闭环的脆弱性也不容忽视。
GPT-多模型调度和长推理链条意味着更多潜在的故障点,而在工业生产、金融交易和医疗诊断等场景中,任何一次错误都可能造成损失,而且你很可能第一时间都不知道是 AI 的问题。
有研究表明,2024 年,微软在 Teams 与 Copilot 深度整合时,曾出现权限 Bug:某个部门的 AI 助手错误地读取了另一个部门的敏感文件;还有 Recall 自动工具,被发现截图时顺带捕捉了密码、银行卡等信息。
值得注意的是,要让智能体真正帮助企业完成业务,必然需要跨系统、跨部门传递数据。
这里面有两个棘手的问题:
1. 责任归属:如果 AI 做出错误决策,导致财务损失或合规事故,责任在 AI 提供商、企业 IT 部门,还是模型本身?
2. 数据安全:无论是美国还是欧盟,对数据都有严格的限制,踩线可能面临巨额罚款。
如果这三道坎都能跨过去,接下来又出现了新问题:越来越多的智能体在帮人做事,那人类还能做什么呢?我认为,人类至少还有三种能力,正变得越来越稀缺:
1. 提出战略性问题的能力,这些问题没有标准答案,需要综合考虑、看清大势。
比如说:这个季度是压利润换市场份额,还是保住利润牺牲增长?要不要冒险抢先布局?这些问题不仅涉及数据,还关乎价值观、文化,甚至是政治判断。
AI 能给你列出各种方案的优缺点,但最终的决定只能由人来做。
2. 设计规则与价值交换的能力。在一个智能体生态中,不同的系统、部门甚至公司之间需要不断交换数据和成果。
这就要求有人先设定好规则,比如:制造智能体在不同供应商之间调配产能,优先级该如何确定?利益如何平衡?
3. 反共识的能力。
GPT-5 的知识来源于现有的信息和模式识别,它会综合主流观点,得出一个“平均的解决方案”。但真正颠覆性的创新,往往来自于对常规的质疑和推翻。
例如,iPhone 刚推出时,大多数人认为全触屏不可行;特斯拉刚进军汽车行业时,整个行业对电动车并不看好;人类的创造力,常常源自跨界的偶然火花,源自对主流逻辑的质疑。
因此,在我看来,尽管 GPT-5 强大,但它的能力只是将执行力推向了一个新高度,而人类的优势正在从“会做事”转向“会决策、会设计规则、会逆流而行”。
总而言之,尽管 GPT-5 的出现让人兴奋,但我并不觉得它强到能够碾压一切,反而更像是在借鉴中国的经验,尤其是在智能代理这一领域。
Sam Altman,真是太擅长“借鉴”了。
本文来自微信公众号:王智远,作者:王智远
本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系 hezuo@huxiu.com
本文来自虎嗅,原文链接:
https://www.huxiu.com/article/4669901.html?f=jinritoutiao

GPT-5的多模型协作确实很有趣,能根据任务自动切换,提升了使用效率。不过,从根本上看,这只是架构的优化,而非真正的技术飞跃。期待未来的更多创新。
对GPT-5的评价很到位,确实是架构优化而非革命性提升。多模型协作让用户体验更好,但底层技术变化有限。
GPT-5的动态路由器设计很有意思,它能根据任务复杂度调整模型,这样的优化确实提升了用户体验,但从根本上看还是在现有技术框架上进行改进。
GPT-5的能力提升确实让人期待,尤其是代码生成和任务分配的功能,感觉能大幅提高工作效率。不过,对它是否算得上技术飞跃,我持保留态度,毕竟只是对已有技术的优化而已。
GPT-5的多模型协作确实能提升效率,但从根本上看,它的变化更多是优化而非革命。如果能在底层架构上实现更大的突破,那才是真正的飞跃。
GPT-5的动态路由器设计让人眼前一亮,不同任务能自动选择合适模型,确实提高了效率。但这种变化是否真能算作技术飞跃,还需观察。
GPT-5的代码生成能力提升确实令人期待,但究竟能否改变程序员的工作模式,还有待观察。整体来看,它的优化让使用体验更好,但技术的本质变化似乎不够显著。
GPT-5的动态路由器概念很吸引人,它能根据任务类型自动选择模型,这确实提升了效率。不过,真正的技术飞跃还需要更深层次的创新。
GPT-5的代码生成能力确实令人振奋,但它能否真正改变程序员的工作方式,还有待时间验证。多模型协作的设计很巧妙,提升了使用体验。
GPT-5的多模型协作设计很有趣,确实提高了处理效率。不过,是否能称得上技术飞跃,还是个值得探讨的问题。