
这件事情听起来像是行业的友好举措,实际上却很有商业智慧。Codex 其实并不是单纯的聊天工具,它是一个能处理文件、执行命令、抓取网页的工作平台。在这个平台上,模型可不是简单地聊天,而是要真正完成工作。谁能接入这个平台,谁就能在这张桌子上占有一席之地;而无法接入的,就只能在边上看热闹了。
问题来了,很多人看到“支持第三方模型”就兴奋了,觉得像 DeepSeek、Qwen、Kimi 这样的模型终于可以直接进驻 Codex,仿佛生态一下子就统一了。但当真正试用的时候,才发现其实并不是那么回事,OpenAI 开的并不是大门,而是个侧门,而且还有门禁限制。

想象一下,你去海底捞吃火锅,服务员说可以自带锅底,你兴高采烈地带着自家的底料进来,结果发现店里只认特定型号的锅具,锅底可以带,炉子却不匹配。最后还是得折腾半天,先找个翻译器,才能开始煮,听起来像是开放,实际上规则还是由店家说了算。
Codex 的官方文档确实提到过自定义提供者,可以填接口地址、协议类型和鉴权方式,表面上看像是“你想接谁就接谁”,但仔细一看,目前公开支持的协议核心还是 Responses API。其他协议虽然不是完全不能用,但你得先证明自己能按规定出牌,否则即使接口再多也没用。

很多普通聊天模型最喜欢说“OpenAI 兼容”,听起来像是万能钥匙,但实际上,这两个字的含金量很低。Chat Completions 是一套,Responses API 是另一套,虽然表面上都能发消息,实际上背后的结构完全不同。工具调用、推理过程的处理、结果的延续,差之毫厘,Agent 就可能卡壳。

简单来说,聊天产品是“你问我答”,而 Agent 工具则是“你下任务,我来执行并反馈”,这两者的层次完全不同。前者像是在街边闲聊,后者则像是在团队中协作,摊主再会聊天也不代表他能把整个供应链都跑通。
所以在这次测试中,DeepSeek 直接无法连接 Codex 一点也不奇怪。很多人以为只要拿到 OpenAI Key 就能随意接入,结果一碰壁才明白,接口名字相似并不代表底层规则也相同。返回 404 的瞬间,就是最真实的商业信息。

就像那些华强北的山寨机,外观和苹果差不多,桌面图标也像,启动动画也很相似,但真正拿去插卡、连蓝牙、运行系统时,问题就暴露出来了。看起来能用,并不代表能长久用,接口的兼容性也是同样的道理。
OpenAI 的小聪明就在于,它并没有拆掉自己的围墙,而是稍微放宽了些许,让外部的人能看见内部的操作,也能进入工作,但整个工地的管理和标准,依然是它在掌控。换句话说,它不是在放权,而是在扩大控制范围。

你可能觉得它是为了防止用户流失而开始开放,实际上更像是它发现了新的盈利逻辑。单靠自家的模型收取订阅,收益上限有限,真正有价值的是工作流的入口,是开发者每天使用的工具平台。谁在这个平台上待得越久,谁就越容易被持续使用。
这两年,AI 行业最虚的词就是“生态”,说得像是万物生长,实际上到头来就是一句话:谁掌握了工作入口,谁就能掌握复购权,谁掌握了复购,谁就有定价权。模型本身不过是入场券,工作平台才是战场。

Codex 这样的 Agent 工具,正是典型的入口生意。
它不是单纯的答案,也不是一次性的对话,而是把任务拆分成多步走,先查资料,再调用工具,再执行命令,再读取结果,最后输出一个可交付的文件。无论是 Markdown 还是 HTML,实质上都只是交付的结果,真正有价值的是那整条工作链。

一旦这条链掌握在平台手中,用户就会逐渐形成使用习惯。今天用它写文档,明天让它整理网页,后天再用它跑脚本。时间一长,用户不再是在选模型,而是在选择哪个平台的工作流最方便,哪个环境最顺手,哪个切换成本最高。
这就是平台常做的事情,先让你用得舒服,再慢慢锁住你。

别看这次第三方模型的接入像是 OpenAI 变得温柔了,实际上它是在打更深层次的算盘。官方模型继续提供最佳体验,而第三方模型则负责填补场景、提高覆盖率、降低成本。用户嘴上说自由,实际上依旧是在它的生态中打转,最终谁能获利,答案其实很明显。
更妙的是,这种开放姿态还能刺激外部开发者和资本市场的兴趣。大家看到“Codex 支持第三方模型”,就开始幻想国产模型的未来,股价、热度、讨论度随之上升。表面上是技术合作,实际上也是一种市场叙事,大家都想借此新故事捞一把。

国产模型这些年热衷于“平替”,但平替并不是嘴上说说而已,而是要看谁能真正融入开发者的日常工作流。光有便宜的 API 没用,光是跑分高也没用,开发者不在你这里工作,你不过是个试用版,连充电器都未必能长期卖出去。
所以这次很多国产模型厂商兴奋,确实有他们的理由。
因为真正的竞争,不是在发布会上那一小时,而是在开发者每天打开终端、IDE、工作平台的那一刻。谁能在这里留下来,谁才能算进了游戏,谁只能在微博上刷热搜,谁就还是个卖概念的角色。
你看智谱最近的举动就很典型,GLM-5.2 一发布,宣传重点不是“我又变强了”,而是 1M 长上下文、长程任务、编程能力和工程调试。这些词背后不是什么玄学,而是在深入真实工作场景。因为现在比拼的不是谁能说得好,而是谁能持续执行、减少错误和返工。
模型厂商以前总喜欢比参数,今天谁有多少 B,明天谁得分多少,搞得像是在卖手机内存条。用户看着热闹,但真到工程场景,参数高不等于能落地,能落地也不等于省钱,最终留下来的,永远是那个更贴近真实工作流程的。
这就像十年前的云计算大战,大家都说上云是趋势,但最后活下来的并不是那些口才最好的,而是能把运维、存储、网络、权限、计费等一整套理顺的几家公司。技术本身不是问题,关键是能把复杂的系统变成顺手的生意,才是解决之道。
回头看,这种“半开放”的套路早就被玩烂了。
苹果当年也是如此,嘴上说生态繁荣,实际上每个入口都在自己手中,App Store、支付、推送、账户,全都是它的领地。开发者看似有选择,实际上却离不开,最后谁敢反对,谁就得面对下架、限流和审核慢的风险。
再往前看,微软也曾干过类似的事情。在 Windows 时代,它把标准和接口牢牢掌握,周边厂商看似百花齐放,实际上都得接受它制定的协议和兼容成本。生态并不是自然形成的,很多时候是“把别人绑在自己的车上”。
如今的 AI 工具平台也同样如此,谁掌握工作台,谁就能决定模型如何接入,工具如何调配,输出如何落地。用户看到的是自由选择,而平台得到的却是规则制定权,这种策略比单纯卖模型要狠得多。
DeepSeek 测试结果背后的真实故事
说到 DeepSeek 最近的测试结果,其实能揭示不少问题呢。
它可不是无能,反而在整理文本、归纳资料和生成文档这些事情上,表现得相当不错。现在的国产模型可不是只会闲聊了,处理招商文档、制作结构化 PPT、整理网页内容等任务,它都能轻松搞定,成本也低得让人惊讶,一轮下来只要几毛钱,连一杯奶茶的钱都不够呢。
这就很有意思了,科技发展到现在,许多公司还在用“智能”来当做卖点。其实用户越发现实了,谁便宜、谁能干活、谁出错少,谁就有机会接单,没人愿意再为那些高深莫测的“理念”掏钱,资本市场也是这样,早就不吃那种“未来无限大”的说法了。能不能接到活,能不能续费,能不能真正进入实际应用场景,才是评判的标准。
不过,便宜仅仅是个入场券,并不是终局的答案。
真正的商业护城河,关键不在于今天的便宜,而在于明天是不是还能维持这个价格,供应链是否能支撑,算力账单是否能承受,开发者工具的稳定性如何,Agent 任务链能不能减少坑,这些才是大头,单靠发个 API 可不够。
看到“开源模型接入 Codex”大家都很激动,以为国产模型要逆袭了,其实距离成功还远着呢。今天能接入,不代表明天能留下;今天能完成一两个测试任务,也不意味着能稳定大规模生产;今天省了几块钱,整条链路的成本结构也不一定就翻盘了。
这就好比乐视当年总是讲生态,手机、电视、体育、内容,各个领域都说得热血沸腾,最后一翻账本,现金流却是一片窟窿,光靠讲故事是维持不了供应链的,发布会也掩盖不了欠款,故事越大,翻车的速度越快。
暴风也是,风口来了,估值飞涨,PPT写得像宇宙第一入口,结果真金白银掏完后,才发现产品、内容、硬件、渠道,全是一团糟,连“曾经辉煌”都变成了笑话。
现在 AI 圈里的某些玩法,和当年的这些故事其实没太大区别,都是先拿出一个看起来很美的概念,先把大家的情绪调动起来,接着再慢慢暴露出工程的复杂性、供应链的成本和商业的约束,真正能穿越这些的,少之又少。
所以别被这次的“开放”给冲昏了头,OpenAI 并不是突然慷慨,它只是更懂得如何把外部的能力融入自己的框架中,既让外部模型有机会展现,又不让自己失去主导权,这种手法不新鲜,但确实有效。
若国产模型厂商想借这扇门进来,也别光顾着欢呼,要认清一个事实,今天你能被接入,不代表你就赢了,平台给你流量,不代表它会把控制权交给你,用户愿意试你,并不意味着会一直留住你,所有的便宜和开放,最终都回到一个问题:谁在收租,谁在交租。
简单来说,这并不是一场技术民主化的庆祝,而是一场入口的重新洗牌。
谁都能上桌,但筷子还是别人发的。











