Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

OpenAI Codex的新变化:支持自定义模型了,但别指望轻松接入哦!

在6月17日,X上的OpenAI Codex团队负责人Tibo(@thsottiaux)发了一条推文,告诉大家Codex App、CLI和SDK现在可以接入任何开源模型,不再局限于OpenAI自家的模型。他还贴出了官方配置文档的链接,具体说明了OSS模式和本地提供者的相关信息。看到这条消息,我的第一反应是有点惊讶,因为OpenAI一直给人一种相对封闭的印象,这次突然放开自定义模型,确实让人眼前一亮。

其实,Codex可不是个普通的工具,它更像是一个完整的工作平台,能处理文件的读取、写入,调用shell,抓取网页,执行命令,甚至还能根据工具的反馈继续推理,最终输出结果。换句话说,在Codex中,模型不仅要会“说话”,更要能实际“干活”。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

(图源:X)

以前很多人对OpenAI的封闭性有意见,其实不仅仅是因为模型不开源,更主要是它的工具、模型和工作流程都被封闭在自己的生态系统里。你可以使用,但拆开重组就比较困难。尤其是像Codex这样的Agent工具,它本质上是模型能力、工具调用、上下文管理、权限控制和本地环境的结合体。也就是说,模型越强大,工作台越完整,用户就越难以跳出这个生态圈。如今OpenAI为Codex开设了custom model provider的入口,从产品角度来看,至少不再把Codex死死绑定在自家模型上。

不过,你以为OpenAI真的就这么放开了吗?从雷科技(ID:leitech)的实测来看,事情并没有那么简单。

填个Key就想用第三方模型?可没那么容易。

最容易被误解的其实就是“Codex支持第三方模型”这句话。很多人一看就觉得,既然DeepSeek、Qwen、Kimi这些模型都提供API,有些甚至自称兼容OpenAI API,那我是不是只需把接口地址和API Key填到Codex里,就能直接用呢?我们最开始也这样尝试。Codex的官方高级配置文档确实提到可以定义自定义模型供应商,简单说就是一个provider可以指定Codex如何连接模型,包括接口地址、协议类型、鉴权方式和附加请求信息。你可以在配置文件里添加一个模型供应商,然后让Codex指向它。

然而,当我们首次尝试接入DeepSeek V4 Pro的API时,却遭遇了失败。

看完官方技术文档后,答案也变得明了,Codex确实开放了,但只是部分开放,是有条件的。文档中明确指出,目前自定义供应商公开支持的协议只有Responses API这一种,省略不填时也是默认使用这个协议。简单来说,Codex允许你更换模型供应商,但它目前的公开配置路径只支持Responses API这套协议,模型供应商能否接入,不仅要看它有没有API,还要看它能否提供Codex所需的Responses格式。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

(图源:雷科技制图)

DeepSeek的官方API主入口是Chat Completions,可以通过OpenAI SDK调用,模型也能正常填充DeepSeek V4 Pro。对很多聊天应用、普通API调用和OpenAI SDK兼容的场景来说,这都没问题,但Codex的请求方式可不是这样。我们尝试让Codex直接连接DeepSeek,模型填入DeepSeek V4 Pro,鉴权使用DeepSeek的Key,启动后Codex实际去找的是DeepSeek并不存在的Responses接口,结果返回404。

其实是DeepSeek的OpenAI格式入口并没有提供Codex当前需要访问的Responses API端点。

同样是“兼容OpenAI”,其中也有很多讲究。Chat Completions是一套接口,Responses API则是另一套接口。普通聊天、工具调用、流式输出、推理块、函数调用结果的返回,在不同协议中结构并不完全相同。对用户来说,这些差别都隐藏在配置的后面,但对Codex这种Agent工作台来说,这些差别会直接影响任务能否正常运行。

真正的突破来自DeepSeek的另一个入口,即Anthropic API兼容端点。DeepSeek的官方文档除了提供常见的OpenAI格式入口外,还提供了Anthropic格式入口,后者更适合处理工具调用和工具返回结果这类Agent场景所需的结构,跟Codex的工作方式更契合。我们最终实现的路径,并不是让Codex直接访问DeepSeek,而是在本地加了一个轻量的“翻译器”。Codex依旧按照自己熟悉的方式发起请求,这个翻译器会将请求转换为DeepSeek能理解的格式,DeepSeek返回结果后,再翻译回Codex可以继续执行的格式。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

(图源:雷科技制图)

更简单地说,目前大家期待的DeepSeek、Mimo、Kimi、智谱GLM等模型,目前都无法直接用API Key接入Codex,只能通过转接桥,和之前流行的CC Switch方案没什么区别。当然,如果非要试试“直接”的方式,阿里百炼大模型当前提供了Responses接口,价格是200元/月,确实有需要的小伙伴可以试试看。

DeepSeek驱动的Codex,体验真的好吗?

配置跑通后,我们决定用DeepSeek加Codex来做一些跟雷科技日常工作更贴合的任务,主要是看看第三方开源模型和Codex的结合效果如何。

第一个任务是全网搜索与雷科技相关的信息,包括官网介绍、文章、特色报道,比如MWC、IFA、AWE等展会的报道,最终输出一份雷科技的商务招商文档,格式为Markdown文件。这个任务表面上看似写稿,其实涉及到好几个Agent能力点。它需要先找资料,如果找不到合适的搜索工具,还得能灵活调整策略。获取网页后,要能够提取出有用的信息,信息不能只是简单堆积,还需按照招商文档的结构重新整理,最后还得把结果写成本地的Markdown文件。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

(图源:雷科技制图)

刚开始尝试DeepSeek V4 Pro时,发现内置的网页搜索工具不可用,网页搜索的能力也不太顺畅,它直接选择从本地终端抓取雷科技官网的页面,包括首页、关于我们、联系我们、历史专题列表、MWC26专题、MWC26凯旋报道、AWE2026专题等。最终它生成了一份320行的Markdown文档,内容涵盖了雷科技的品牌定位、媒体矩阵、用户画像、内容栏目、核心数据、展会报道能力、视频化分发、商务合作模式、合作案例和联系方式。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

AI 助手的进化之路:DeepSeek 和智谱的竞争

(图源:雷科技制图)

虽然界面看起来有点简陋,但其实用起来还是不错的。

接下来的任务更具挑战性,我们要基于之前生成的招商文档,制作一份雷科技 2026 年度招商报告的 PPT,并且要输出成 HTML 格式。这一环节主要考验模型的连贯性。如果第一步只是把网页转成 Markdown,那么第二步就是把已有的文档转化为结构化的展示。模型需要搞清楚上一个文件里的九个章节,然后把它们整理成十页的幻灯片,包括封面、雷科技的介绍、媒体矩阵、内容体系、核心数据、全球展会、视频战略、商务合作、合作案例以及联系信息。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

(图源:雷科技制图)

最终,我们得到了一个大约790行的单文件 HTML,文件大小接近40KB,包含了科技感十足的深色主题,搭配蓝紫色的强调,滚动触发的动画效果,右侧的圆点导航,还有键盘的上下翻页功能,支持响应式布局和导出为 PDF。这虽然不是经过精修的设计稿,但已经是一个能打开、预览并继续修改的实用文件。从完成度来看,DeepSeek在这组轻量级任务中的表现还是不错的。它的优势在于资料整理速度快,长文档的组织能力也很强,一旦遇到工具无法使用的情况,它会尝试其他方式生成 Markdown 和 HTML 等文本文件。对于“写介绍”“整理资料”“根据文档生成展示页”这些任务,它已经能够胜任初稿的制作。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

(图源:雷科技制图)

不过,说实话,它的体验还有待提升,和官方模型相比,仍显得不够成熟。Codex + GPT 5.5的所有能力都在一个生态系统里,模型、工具调用、上下文和视觉能力等都能顺畅运行。然而,DeepSeek在Codex的运行链路较长,还经过了一层转接,速度自然没法和“官方组合”相比。

因此在响应速度上,DeepSeek在简单文本和资料整理方面表现尚可,不至于慢到无法使用,但确实比官方模型要慢一些。尤其是进入Codex的这种Agent工作流后,它不是一次性给出答案,而是需要边调用工具边等待结果,同时还要继续推理。多了一层本地翻译,工具调用来回跑,速度感受自然就慢了。

在使用成本上,这次的体验很直接,我们为DeepSeek账户充了10元,完成这两个任务的同时还进行了几轮聊天和调试,最后余额剩下9.27元。也就是说,这一轮轻量测试实际上只花了7毛多。DeepSeek真的是性价比之王,如果全是这样的任务,完全可以考虑放弃每月20美元的ChatGPT Plus订阅。

这波要让智谱和DeepSeek们赢得胜利?

体验下来,对于大多数普通用户来说,Codex能否支持第三方模型,其实意义没有那么大。如果只是想要简单流畅的使用体验,开通Plus会员也还是不错的选择,毕竟它是和ChatGPT捆绑在一起的。

更值得关注的是那些开源模型。

过去,国产和开源模型想要在开发者的实际工作流中占有一席之地,得花费很多功夫去完善产品能力。发布一个模型的API只是第一步,后面还需要IDE插件、命令行工具、文件权限、工具调用、项目上下文、任务记忆、错误恢复、协作界面、审阅流程,这些都是单靠模型论文无法解决的问题。

Codex这类工具的价值在于,它先为工作台搭建好了基础架构。它负责与本地文件系统的交互,执行命令,展示工具调用,把任务拆分成多个阶段,并让模型在上下文中持续工作。第三方模型一旦能够接入,就相当于直接获得一个成熟的Agent容器,这对智谱、DeepSeek、Qwen、Kimi等都是机遇。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

(图源:雷科技制图)

例如智谱,最近推出的GLM-5.2,强调其1M无损上下文和长程任务能力的提升,Coding和长程任务的评测达到了开源的SOTA,在复杂系统工程和深度调试方面表现更为稳定。最近几天,开发者圈对这个模型评价很高,很多人认为它在代码任务和长程Agent场景中的性能非常强。更有趣的是,智谱的GLM Coding Plan已经变成了一种稀缺资源,因其火爆,很多人抢不到,这其实说明国产模型的竞争已经不再只是发布一个强模型,而是围绕Coding Plan、开发工具接入、Agent工作流额度和真实工程体验展开。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

(图源:智谱)

当然,智谱也不是没有自己的Agent工具。它正在打造类似Codex的图形化Agent工作台,让用户能够在其中交给模型进行代码、长程和工程任务的处理。问题在于,对于模型厂商来说,自建工作台和接入Codex这样的成熟工作台并不矛盾。自家的工具更适合展示完整能力和打磨闭环体验,而接入Codex则更像是进入一个已经被大量开发者熟悉的环境。用户本来就在Codex里写代码、运行命令、阅读项目、交付文件,如果国产模型能够出现在同一个任务流里,使用和比较的机会就会增多。

在OpenAI发布消息后,智谱的股价一路飙升,今天盘中一度上涨超过22%,股价突破2000港元大关,市值也达到了新高,创下近期新纪录,这已经说明了一些问题。

Codex真的能驾驭国产开源模型吗?我实测DeepSeek后才发现门槛竟然这么高!

(图源:雅虎财经)

不过,OpenAI也有自己的考量,Codex的开放并不意味着它放弃了控制权。相反,工作台的标准依然由它来定义。Responses API、模型配置、官方推荐模型、工具调用协议、权限机制等关键环节,仍然围绕OpenAI的体系展开。OpenAI可能想要的局面,是让Codex成为更通用的Agent工作台,官方模型负责提供最强能力和最佳体验,而第三方模型则负责扩展场景、降低成本并满足更多供应商的需求。用户可以有选择,但这种选择是在OpenAI定义的工作台上进行的,这显然比单纯的封闭更聪明。

总的来说,Codex的开放显然是一种双赢的局面,对OpenAI来说,它能够推动Codex朝着平台化发展,有可能在不久的将来成为一家独大的AI工作台;而对国产和开源模型而言,它们终于有机会进入一个成熟的工作台,而不再只是停留在自己的Agent里。但目前来说,OpenAI的开放程度仍然不够,远远不够。

来源:百家号
原文标题:Codex真能接国产开源模型?实测DeepSeek后我发现门槛太高了
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论