震撼发布!OpenAI推出超级编程模型GPT5.2-Codex,颠覆你的编程体验!

来自AIPress.com.cn的消息

12月19日,GPT-5.2-Codex终于上线了,这是一个专门为代理编程和终端环境设计的模型。

震撼发布!OpenAI推出超级编程模型GPT5.2-Codex,颠覆你的编程体验!

Altman在发布会上特别指出,GPT-5.2-Codex可不是一个普通的代码补全工具,它其实能在真实的开发环境中执行各种任务

在OpenAI内部,它已经被运用到许多实际项目中,并且效果非常理想。这说明Codex的角色已经发生了转变,不再仅仅是帮人写代码,而是替人完成整个工作流程,比如理解任务、在终端执行命令、修改文件,并不断迭代,直到达到可用的结果。

震撼发布!OpenAI推出超级编程模型GPT5.2-Codex,颠覆你的编程体验!

在另一条推文中,Altman甚至开始招募人才,“Codex正迅速提升能力,如果有人想在明年将它提升100倍,OpenAI正在找人。”

这次更新可不是简单的模型改进,更像是OpenAI在为AI代理的未来铺路。

不过,跟几乎所有新模型发布一样,Codex的初期反馈并不统一。

震撼发布!OpenAI推出超级编程模型GPT5.2-Codex,颠覆你的编程体验!

有些开发者对GPT-5.2-Codex的方向感到很兴奋,尤其是那些习惯用命令行、脚本和自动化工具的人。

他们认为,Codex的关键在于能否减少人们的打断、减少确认过程,直接推进工作。不过,质疑的声音也很快随之而来。

震撼发布!OpenAI推出超级编程模型GPT5.2-Codex,颠覆你的编程体验!

前Google Brain的研究员David Bau对Codex的使用经历发表了看法。他觉得,Codex的表现并没有他预想的那么好,甚至让他开始怀疑自己是不是用了错误的方式。

不过,这些反馈并不是在否定Codex的整体方向,而是很现实地指出了一点:在复杂的代码理解过程中,不同模型之间的差异还是挺明显的

这种反馈其实也反映了Codex在逐渐调整自己的定位。

震撼发布!OpenAI推出超级编程模型GPT5.2-Codex,颠覆你的编程体验!

Codex现在不再试图在通用代码能力上与所有模型正面较量,而是选择了一条新的道路,迅速将设计模型转化为实际可用的原型,并推向生产。

根据OpenAI提供的基准测试结果,GPT-5.2-Codex的性能其实是相当清晰的。

震撼发布!OpenAI推出超级编程模型GPT5.2-Codex,颠覆你的编程体验!

SWE-Bench Pro这个偏向真实工程修复能力的测试中,GPT-5.2-Codex的准确率达到了56.4%,比GPT-5.2稍微高一点,显著超越了GPT-5.1。虽然这个成绩不是压倒性的第一,但也充分说明Codex并不是牺牲能力来换取工具权限。

而在Terminal-Bench 2.0这个更贴近命令行操作的测试中,Codex的优势被进一步彰显,准确率高达64.0%,明显高于GPT-5.2和之前的Codex。

Codex的实力与未来展望

震撼发布!OpenAI推出超级编程模型GPT5.2-Codex,颠覆你的编程体验!

把GPT-5.2-Codex和其他模型放在一起比比看,像SWE-Bench Pro、Terminal-Bench 2.0、GPQA Diamond以及AIME 2025这些测试中,它的表现已经和Claude Opus 4.5、Gemini 3 Pro平起平坐,甚至在某些方面还稍微领先。

不过,这些数据并不意味着Codex就是最强的存在,但它确实传达了一个明确的信号:OpenAI正在坚定不移地朝着一种新的方向前进

从现在开始,“工程型AI agent”不再只是个空谈,而是在不断迭代中逐步向我们走来

来源:今日头条
原文标题:刚刚!OpenAI发布最强编程模型GPT5.2-Codex – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论