震撼发布！OpenAI推出超级编程模型GPT5.2-Codex，颠覆你的编程体验！

来自AIPress.com.cn的消息

12月19日，GPT-5.2-Codex终于上线了，这是一个专门为代理编程和终端环境设计的模型。

Altman在发布会上特别指出，GPT-5.2-Codex可不是一个普通的代码补全工具，它其实能在真实的开发环境中执行各种任务。

在OpenAI内部，它已经被运用到许多实际项目中，并且效果非常理想。这说明Codex的角色已经发生了转变，不再仅仅是帮人写代码，而是替人完成整个工作流程，比如理解任务、在终端执行命令、修改文件，并不断迭代，直到达到可用的结果。

在另一条推文中，Altman甚至开始招募人才，“Codex正迅速提升能力，如果有人想在明年将它提升100倍，OpenAI正在找人。”

这次更新可不是简单的模型改进，更像是OpenAI在为AI代理的未来铺路。

不过，跟几乎所有新模型发布一样，Codex的初期反馈并不统一。

有些开发者对GPT-5.2-Codex的方向感到很兴奋，尤其是那些习惯用命令行、脚本和自动化工具的人。

他们认为，Codex的关键在于能否减少人们的打断、减少确认过程，直接推进工作。不过，质疑的声音也很快随之而来。

前Google Brain的研究员David Bau对Codex的使用经历发表了看法。他觉得，Codex的表现并没有他预想的那么好，甚至让他开始怀疑自己是不是用了错误的方式。

不过，这些反馈并不是在否定Codex的整体方向，而是很现实地指出了一点：在复杂的代码理解过程中，不同模型之间的差异还是挺明显的。

这种反馈其实也反映了Codex在逐渐调整自己的定位。

Codex现在不再试图在通用代码能力上与所有模型正面较量，而是选择了一条新的道路，迅速将设计模型转化为实际可用的原型，并推向生产。

根据OpenAI提供的基准测试结果，GPT-5.2-Codex的性能其实是相当清晰的。

在SWE-Bench Pro这个偏向真实工程修复能力的测试中，GPT-5.2-Codex的准确率达到了56.4%，比GPT-5.2稍微高一点，显著超越了GPT-5.1。虽然这个成绩不是压倒性的第一，但也充分说明Codex并不是牺牲能力来换取工具权限。

而在Terminal-Bench 2.0这个更贴近命令行操作的测试中，Codex的优势被进一步彰显，准确率高达64.0%，明显高于GPT-5.2和之前的Codex。

Codex的实力与未来展望

把GPT-5.2-Codex和其他模型放在一起比比看，像SWE-Bench Pro、Terminal-Bench 2.0、GPQA Diamond以及AIME 2025这些测试中，它的表现已经和Claude Opus 4.5、Gemini 3 Pro平起平坐，甚至在某些方面还稍微领先。

不过，这些数据并不意味着Codex就是最强的存在，但它确实传达了一个明确的信号：OpenAI正在坚定不移地朝着一种新的方向前进：

从现在开始，“工程型AI agent”不再只是个空谈，而是在不断迭代中逐步向我们走来。

来源：今日头条

原文标题：刚刚！OpenAI发布最强编程模型GPT5.2-Codex – 今日头条

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！