OpenAI 刚过完十岁生日,但似乎不太开心。
那天推出的 GPT-5.2 表现得相当不错,很多测试都一骑绝尘,尤其在数学和编程的挑战中表现令人眼前一亮,官方甚至称赞它是 AI 的“超级大脑”。
不过,社交媒体上却不是一片欢呼,而是用户们齐心协力的吐槽。

在 X 和 Reddit 上,愤怒与失望几乎充斥每一条评论。大家都在怀念曾经那个让人心动的 GPT-4o:有人觉得 GPT-5.2 变得平淡无奇,丧失了锋芒;还有人调侃它像是“把成年人当成小朋友来教育”。
当舆论的火力集中在 OpenAI 和 CEO 山姆·奥特曼身上时,一个尖锐的问题浮现:模型变得更“聪明”了,为什么反而不受欢迎了呢?

为何更“聪明”的模型不再受欢迎
《信息时报》今天凌晨的报道揭示了背后的原因。
过去一年,OpenAI 一直有一个固定的信念:每次模型的更新都会带来用户数量的激增,因为“变聪明”意味着用户体验的直观提升。但现在,这一信念似乎不再成立。
当然,模型在智能和科学计算方面的进步依然显著。研究团队花了几个月精心打磨推理能力,使其能够解决更复杂的数学和科学问题,但对大多数普通用户来说,这种改进几乎无从察觉。

https://www.theinformation.com/articles/openais-organizational-problems-hurt-chatgpt?rc=qmzset
换句话说,智能的提升并不意味着用户体验的改善。
普通用户其实并不需要一台“竞赛级的脑袋”,他们更希望有一个“日常好用的助手”。根据 OpenAI 对 150 万次对话的分析,用户的核心需求非常接地气:实用指导(占29%)、信息查询(占24%),以及写作(占24%),而与编程相关的需求仅占 4.2%。
### 当技术与用户需求碰撞时,我们该如何选择?
说到这个矛盾,其实真的是挺明显的:技术团队在实验室里拼命搞各种复杂的测试,而用户在聊天框里只想要一句简单明了的解决方案——别拐弯抹角,直接告诉我该怎么做。
把事情搞复杂可不是个好主意。
今年,奥特曼同时启动了不少新项目,比如视频生成的 Sora、音乐 AI、浏览器、AI Agent、硬件设备还有机器人……这些新尝试让资源分散得越来越严重。
这其实是科技公司常犯的错误:核心还没稳住,就急着往外扩展。短期内看似是全面开花,但长远来看,结果往往是贪多嚼不烂——每条战线都缺人、缺算力,连耐心都不够去打磨产品。

在 OpenAI 内部,「研究优先」与「产品增长」之间的矛盾尤为明显:
尽管 GPT-4o 的吉卜力风格在三月一度提升了 ChatGPT 的使用量,但 OpenAI 还是将图像模型的开发放在了后面。等到 Nano Banana 的口碑开始发酵后,OpenAI 又紧急回头补课,结果内部出现了分歧——
奥特曼认为图像模型是吸引用户的关键,而研究主管 Mark Chen 更倾向于把资源投入到其他项目上。
此外,随着 Scaling Laws 的边际效益递减,为了解决大模型的瓶颈,过去一年 OpenAI 把重心放在了推理模型上,超过 1000 人的团队都在这个方向上努力,导致对 ChatGPT 日常体验的优化被忽视。

这种做法不仅让资源分散,年初的内测中甚至出现了性能下滑——为了适应「聊天」场景,反而削弱了推理模型的纯粹性。虽然后续推出了「思考模式」和「深度研究」来试图解决这个问题,但用户的使用情况却不理想,日常对话体验并没有因此改善。
而且,新旧模型之间常常会出现兼容问题。
比如在发布 GPT-5 前,研究团队发现当模型集成到 ChatGPT 中时,在某些编程任务上的表现反而变差——因为系统根据用户的职业等个性化信息调整回答,结果干扰了模型的理解,导致错误答案。
虽然推理模型越来越强,但 ChatGPT 的使用体验却越来越糟。

当技术发展的方向和用户的需求出现分歧时,谁会先让步呢?答案其实很明显。
Gemini 3 Pro 的强势发布,逼迫 OpenAI 走到了墙角,最终导致奥特曼发布了「红色警报」,要求团队重新聚焦于 ChatGPT,提升产品体验的吸引力。
与此同时,OpenAI 的应用负责人 Fidji Simo 在她的个人博客里分享了 ChatGPT 的未来愿景。她希望这个对话系统不仅仅是局限于文本,而是能根据用户的需求,灵活地生成界面,简而言之,就是要实现全自动的用户界面。
不过,Simo 也坦言,公司的本质依然是以研究为主,「产品本身并不是我们最终的目标。」

从商业角度来看,这番话其实风险不小。
与更注重 API 市场的 Anthropic 不同,OpenAI 的主要收入来源是个人用户的订阅。在消费市场上,谁会为公司的「理想」埋单呢?用户更关注的是现在的体验。这就像是一位厨师专注于烹饪米其林级的菜品,而顾客们却只是想要一碗热乎乎的阳春面。
不过,如果你因此就认为 OpenAI 内部已经出现混乱,那可就小看了这家公司了。
据彭博社引用 Mark Chen 的话说,「红色警报」其实并不是新鲜事,更像是他们在战时状态下的一种常规管理工具。每当 OpenAI 需要集中力量解决某个特定目标,或者让团队暂时放下低优先级的任务时,这种机制就会启动。

播客地址:
https://x.com/Kantrowitz/status/2001790090641645940
在最近的播客中,奥特曼也否认了红色警报带来的过度紧张情绪。
他说:「首先,我们认为所谓的『红色警报』其实是一种低风险但必要的应对策略。」奥特曼坦诚地表示,「在潜在的竞争压力面前,保持一些『偏执』并迅速反应,是件好事。」
他还提到了今年初 DeepSeek 的崛起,认为这和当前的 Gemini 3 一样,都是对他们的良性刺激。
「截至目前,Gemini 3 并没有带来我们最担心的毁灭性影响。虽然它像 DeepSeek 一样,精准地暴露了我们在产品策略上的短板,但也促使我们迅速调整。」

在奥特曼的眼中,这种紧急状态一般也就持续六到八周。「我很高兴我们有这样的快速反应机制,我们不会在这种状态下待太久。」
显然,OpenAI 也明白仅靠口号是不够的,今天他们正式推出了 GPT-5.2-Codex。
标题:OpenAI的挑战与机遇:从GPT-5.2到与Google的较量
GPT-5.2-Codex是一个专为应对复杂软件工程问题而设计的智能编程模型,结合了GPT-5.1-Codex-Max的终端操作能力,特别擅长处理代码的重构和迁移等长程任务。
在一次播客的结束时,当主持人问到“GPT-6还要等多久?”时,奥特曼坦言:“我不确定我们什么时候会把某个模型称作GPT-6,但我预测在明年第一季度,会有一个比5.2更强大的新模型发布。”
从发出“红色警报”到推出GPT-5.2系列,再到对GPT-6的模糊预告,OpenAI显然想通过新模型和新节奏来重建用户的信心。然而,决定长期胜负的因素依然是分发渠道、生态协同和算力成本等硬性门槛。
Google的布局与OpenAI的“空城计”
Google的优势不只体现在Gemini 3 Pro这个模型上,更在于它几乎无可匹敌的分发渠道。
无论是搜索引擎、Chrome,还是办公套件,在AI领域,护城河或许是所有科技产品中最浅的。当Google的AI产品无处不在时,用户几乎不需要“被说服”,自然就会选择使用。
更重要的是,在与Google的竞争中,OpenAI的硬件短板成为了最大的软肋。
与Google早在十二年前就开始布局专用AI芯片(TPU)所形成的效率优势相比,OpenAI每年仍需花费数十亿美元租用算力。即使试图通过自建数据中心和芯片来“补课”,但当前体验被追平、成本被压制的现状显而易见。
网友们直言不讳:OpenAI现在不需要一个更强大的模型,它需要的是AMD。若OpenAI收购了AMD,AI之战可能会迎来终结。Google之所以不怕OpenAI,正是因为它拥有自家的TPU,但真正需要担心的,反而是OpenAI若拥有AMD。
OpenAI的总裁Greg Brockman在最近的一段视频中也坦言,由于算力资源紧张,每当新功能上线(比如年初推出的GPT-4o吉卜力风格),就不得不从研发部门“抽血”,把算力挪给产品部。这种做法无疑是饮鸩止渴——为了维持当下的用户体验,不得不推迟未来的技术研发。
而算力归根结底就是两个字:烧钱,且是大把大把地烧。
因此,依据《华尔街日报》的报道,OpenAI已经计划进行1000亿美元的巨额融资,若一切顺利,预计这家超级独角兽在明年第一季度前将以8300亿美元的估值,再次刷新资本市场的想象。
今年早些时候,软银同意向OpenAI投资300亿美元,并于上月出售所持的英伟达股份,筹集了58亿美元,以为这笔投资做准备,并预计尽快完成剩余的225亿美元出资。
但资金问题并不简单。预计到2030年,OpenAI的现金消耗将超过2000亿美元。相比之下,Google的财务状况稳健,甚至可以通过与Oracle等合作伙伴的股价波动间接影响OpenAI的融资前景。
正忙着筹款的OpenAI,看起来像是在和时间赛跑。这也促生了那句笑话:凭借奥特曼的融资能力,或许哪天连Google和英伟达都能被“打包带走”。
### OpenAI的转折点:重拾用户体验的重要性
哈哈,开个玩笑,钱虽然能买到时间,但可买不到大家的好口碑。
所以到了2025年的冬天,经历了三年疯狂发展的OpenAI决定踩一脚刹车,这其实是个聪明的选择:收缩战线、调整资源,把重心放回到ChatGPT的日常使用体验上。
这笔花费虽大,但却是必须的调整。
毕竟,技术领先并不代表产品就一定好用,基准测试的高分也不等于用户的满意度。更何况,不能等到用户怀念旧版本时才想起要了解他们的真实感受。
#关注我们的官方微信公众号:爱范儿(微信号:ifanr),第一时间获取更多精彩内容。
爱范儿 | 原文链接· ·新浪微博
