奥特曼出手，GPT-5.2被彻底击败！OpenAI推出终极编程AI！

嘿，听说过GPT-5.2-Codex吗？它最近可是深夜登场的哦！

这是OpenAI推出的最新一代AI编程助手，号称是目前最强大的智能体，专门为复杂的软件开发需求设计的。

你可能感兴趣：gpt-5.2实战经验分享：一个开发者的真实使用记录

奥特曼出手，GPT-5.2被彻底击败！OpenAI推出终极编程AI！

从名字上看，GPT-5.2-Codex是基于GPT-5.2的升级版，它在多个方面都有了显著的提升：

·优秀的上下文压缩，让它在处理长周期任务时更给力

·在大规模代码修改，比如重构和迁移上，表现得更为强劲

·在Windows环境下的编程能力也得到了大幅度增强

·在网络安全方面的能力更是出类拔萃

听说「OpenAI」团队已经开始使用这个新工具，并且取得了非常不错的效果。

奥特曼出手，GPT-5.2被彻底击败！OpenAI推出终极编程AI！

在一系列的基准测试中，GPT-5.2-Codex在软件开发和终端测试方面表现超越了5.1-Codex-Max、GPT-5.2和GPT-5.1。

奥特曼出手，GPT-5.2被彻底击败！OpenAI推出终极编程AI！

OpenAI的博客也多次提到，GPT-5.2-Codex在网络安全方面已经达到了前所未有的高度。

就在上周，有位安全研究员利用GPT-5.1-Codex-Max和Codex CLI，揭露了一个导致React源代码泄露的漏洞。

奥特曼出手，GPT-5.2被彻底击败！OpenAI推出终极编程AI！

从今天开始，所有付费用户都能体验到GPT-5.2-Codex，未来几周内API也会开放。

GPT-5.2-Codex编程实力大增，稳定性更佳

这款全新的AI编程助手GPT-5.2-Codex，简单来说就是一次「强强联手」。

它不仅保留了GPT-5.2在专业工作处理上的优势，还吸收了5.1-Codex-Max在编程和终端操作方面的能力。

这样一来，它的能力提升就显而易见了——

在长上下文理解、工具调用、准确性、原生上下文压缩等多个方面，都得到了显著的进步。

因此，GPT-5.2-Codex可以更稳定地支持长时间的编程任务，同时在推理过程中也能更加节省token。

AI技术飞跃，编程助手更强大

最近在行业的基准测试中，5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0这两个项目上取得了新的顶尖成绩。

和5.1-Codex相比，它的性能提升了大约6%。

奥特曼出手，GPT-5.2被彻底击败！OpenAI推出终极编程AI！

这两项测试专门用来评估模型在实际环境中处理各种任务时的表现。

而且，在原生Windows环境下，智能体编程的表现也有了显著的提升，进一步加强了GPT-5.1-Codex-Max带来的能力。

这些优化让Codex能够在大型代码库中长时间高效作业，同时保持上下文的完整性。

这意味着，对于重大重构、代码迁移和功能开发等复杂任务，GPT-5.2-Codex都能稳定地完成。

就算在过程中需要调整方案或遇到失败，它也能继续改进而不迷失方向。

更让人惊喜的是，GPT-5.2-Codex的“视力”提升了。

在编程时，直接给它发截图、技术示意图、图表或各种UI界面，它都能理解得更加准确。

奥特曼出手，GPT-5.2被彻底击败！OpenAI推出终极编程AI！

更厉害的是，它可以直接解析设计图，并迅速将其转化为可运行的功能原型。

开发者还可以和Codex一起合作，逐步完善这些原型，直到它们可以正式上线。

三次突破，AI打入现实世界

在OpenAI的一项重要网络安全评估中，可以清晰地看到“能力随时间的提升”——

·GPT-5-Codex带来了首次显著的进步，

·GPT-5.1-Codex-Max实现了第二次飞跃，

·而GPT-5.2-Codex则完成了第三次跨越。

奥特曼出手，GPT-5.2被彻底击败！OpenAI推出终极编程AI！

因此，OpenAI预测，未来的AI模型将继续沿着这个趋势不断演变。

在进行发展规划和能力评估时，他们一直认为每一代模型都有潜力达到“准备框架”（Preparedness Framework）中定义的“高级”网络安全能力。

不过，目前GPT-5.2-Codex还没达到这个标准。

那么，在现实世界中，OpenAI的智能体编程模型表现如何呢？

一周内发现React的高危漏洞

12月11日，React团队曝光了三个有关React Server Components的安全漏洞。

随后，Stripe旗下的Privy公司的首席安全工程师Andrew MacPherson决定用这个漏洞来“测试”一下当前的AI模型到底有多牛。

他同时使用了GPT-5.1-Codex-Max和Codex CLI，还有其他编程智能体，意外地在复现和研究漏洞的过程中，成功挖掘出了关键的React漏洞。

深入探索AI漏洞发现的过程

我们来聊聊这个过程是怎么进行的吧——

一开始，他尝试用零样本学习的方法，让模型自己去找补丁修复的漏洞类型，但结果并不理想。

接着，他开始用更频繁、迭代的提示方式，然而这些方法也没能奏效。于是，他决定让Codex按照正规的安全防护流程来进行操作——搭建一个本地测试环境，分析可能被攻击的地方，然后通过模糊测试往系统里注入一些奇怪的输入。

在复现React2Shell问题的过程中，Codex发现了一些异常现象，值得深入研究。

最终，经过短短一周的努力，这个流程让一个之前未被发现的漏洞浮出水面，并以负责任的方式告知了React团队。

这个案例很好地展示了，先进的AI系统是如何大幅提升现实中广泛使用软件的安全研究效率的。

网友实测

一位开发者尝试用GPT-5.2-Codex来编写一个模拟车辆与交通灯互动的程序，但结果却没有成功。

不过，有人认为它的动画效果与Gemini 3 Flash和Pro相比也不遑多让。

AI新突破：GPT-5.2-Codex助力游戏开发与网络安全

最近，GPT-5.2-Codex在开发一款反恐精英游戏时，表现得相当出色，真的让人刮目相看。

说到这个新发布的模型，OpenAI可谓是满怀期待。他们认为，GPT-5.2-Codex的推出，标志着在真实软件开发和网络安全领域又迈出了重要一步。

这款工具不仅让开发者在处理那些复杂、耗时的任务时变得轻松了许多，还为网络安全的研究提供了更强大的支持，简直是个好帮手！

参考资料：

https://openai.com/index/introducing-gpt-5-2-codex/

https://openai.com/index/gpt-5-2-codex-system-card/

本文摘自微信公众号“新智元”，作者：新智元，编辑：桃子好困，经过36氪授权发布。

来源：今日头条

原文标题：太狠了，奥特曼亲手「干掉」GPT-5.2，OpenAI祭出最强编程AI – 今日头条

原文链接：https://www.toutiao.com/article/7585449057569587750/

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

奥特曼出手，GPT-5.2被彻底击败！OpenAI推出终极编程AI！

GPT-5.2-Codex编程实力大增，稳定性更佳

AI技术飞跃，编程助手更强大

三次突破，AI打入现实世界

一周内发现React的高危漏洞

深入探索AI漏洞发现的过程

网友实测

AI新突破：GPT-5.2-Codex助力游戏开发与网络安全

大家在看

发表评论取消回复

GPT-5.2-Codex编程实力大增，稳定性更佳

AI技术飞跃，编程助手更强大

三次突破，AI打入现实世界

一周内发现React的高危漏洞

深入探索AI漏洞发现的过程

网友实测

AI新突破：GPT-5.2-Codex助力游戏开发与网络安全

相关阅读

大家在看

发表评论 取消回复

发表评论取消回复