嘿,听说过GPT-5.2-Codex吗?它最近可是深夜登场的哦!
这是OpenAI推出的最新一代AI编程助手,号称是目前最强大的智能体,专门为复杂的软件开发需求设计的。

从名字上看,GPT-5.2-Codex是基于GPT-5.2的升级版,它在多个方面都有了显著的提升:
·优秀的上下文压缩,让它在处理长周期任务时更给力
·在大规模代码修改,比如重构和迁移上,表现得更为强劲
·在Windows环境下的编程能力也得到了大幅度增强
·在网络安全方面的能力更是出类拔萃
听说「OpenAI」团队已经开始使用这个新工具,并且取得了非常不错的效果。

在一系列的基准测试中,GPT-5.2-Codex在软件开发和终端测试方面表现超越了5.1-Codex-Max、GPT-5.2和GPT-5.1。

OpenAI的博客也多次提到,GPT-5.2-Codex在网络安全方面已经达到了前所未有的高度。
就在上周,有位安全研究员利用GPT-5.1-Codex-Max和Codex CLI,揭露了一个导致React源代码泄露的漏洞。

从今天开始,所有付费用户都能体验到GPT-5.2-Codex,未来几周内API也会开放。
GPT-5.2-Codex编程实力大增,稳定性更佳
这款全新的AI编程助手GPT-5.2-Codex,简单来说就是一次「强强联手」。
它不仅保留了GPT-5.2在专业工作处理上的优势,还吸收了5.1-Codex-Max在编程和终端操作方面的能力。
这样一来,它的能力提升就显而易见了——
在长上下文理解、工具调用、准确性、原生上下文压缩等多个方面,都得到了显著的进步。
因此,GPT-5.2-Codex可以更稳定地支持长时间的编程任务,同时在推理过程中也能更加节省token。
AI技术飞跃,编程助手更强大
最近在行业的基准测试中,5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0这两个项目上取得了新的顶尖成绩。
和5.1-Codex相比,它的性能提升了大约6%。

这两项测试专门用来评估模型在实际环境中处理各种任务时的表现。
而且,在原生Windows环境下,智能体编程的表现也有了显著的提升,进一步加强了GPT-5.1-Codex-Max带来的能力。
这些优化让Codex能够在大型代码库中长时间高效作业,同时保持上下文的完整性。
这意味着,对于重大重构、代码迁移和功能开发等复杂任务,GPT-5.2-Codex都能稳定地完成。
就算在过程中需要调整方案或遇到失败,它也能继续改进而不迷失方向。
更让人惊喜的是,GPT-5.2-Codex的“视力”提升了。
在编程时,直接给它发截图、技术示意图、图表或各种UI界面,它都能理解得更加准确。

更厉害的是,它可以直接解析设计图,并迅速将其转化为可运行的功能原型。
开发者还可以和Codex一起合作,逐步完善这些原型,直到它们可以正式上线。
三次突破,AI打入现实世界
在OpenAI的一项重要网络安全评估中,可以清晰地看到“能力随时间的提升”——
·GPT-5-Codex带来了首次显著的进步,
·GPT-5.1-Codex-Max实现了第二次飞跃,
·而GPT-5.2-Codex则完成了第三次跨越。

因此,OpenAI预测,未来的AI模型将继续沿着这个趋势不断演变。
在进行发展规划和能力评估时,他们一直认为每一代模型都有潜力达到“准备框架”(Preparedness Framework)中定义的“高级”网络安全能力。
不过,目前GPT-5.2-Codex还没达到这个标准。
那么,在现实世界中,OpenAI的智能体编程模型表现如何呢?
一周内发现React的高危漏洞
12月11日,React团队曝光了三个有关React Server Components的安全漏洞。
随后,Stripe旗下的Privy公司的首席安全工程师Andrew MacPherson决定用这个漏洞来“测试”一下当前的AI模型到底有多牛。
他同时使用了GPT-5.1-Codex-Max和Codex CLI,还有其他编程智能体,意外地在复现和研究漏洞的过程中,成功挖掘出了关键的React漏洞。
深入探索AI漏洞发现的过程
我们来聊聊这个过程是怎么进行的吧——
一开始,他尝试用零样本学习的方法,让模型自己去找补丁修复的漏洞类型,但结果并不理想。
接着,他开始用更频繁、迭代的提示方式,然而这些方法也没能奏效。于是,他决定让Codex按照正规的安全防护流程来进行操作——搭建一个本地测试环境,分析可能被攻击的地方,然后通过模糊测试往系统里注入一些奇怪的输入。
在复现React2Shell问题的过程中,Codex发现了一些异常现象,值得深入研究。
最终,经过短短一周的努力,这个流程让一个之前未被发现的漏洞浮出水面,并以负责任的方式告知了React团队。
这个案例很好地展示了,先进的AI系统是如何大幅提升现实中广泛使用软件的安全研究效率的。
网友实测
一位开发者尝试用GPT-5.2-Codex来编写一个模拟车辆与交通灯互动的程序,但结果却没有成功。
不过,有人认为它的动画效果与Gemini 3 Flash和Pro相比也不遑多让。
AI新突破:GPT-5.2-Codex助力游戏开发与网络安全
最近,GPT-5.2-Codex在开发一款反恐精英游戏时,表现得相当出色,真的让人刮目相看。
说到这个新发布的模型,OpenAI可谓是满怀期待。他们认为,GPT-5.2-Codex的推出,标志着在真实软件开发和网络安全领域又迈出了重要一步。
这款工具不仅让开发者在处理那些复杂、耗时的任务时变得轻松了许多,还为网络安全的研究提供了更强大的支持,简直是个好帮手!
参考资料:
https://openai.com/index/introducing-gpt-5-2-codex/
https://openai.com/index/gpt-5-2-codex-system-card/
本文摘自微信公众号“新智元”,作者:新智元,编辑:桃子 好困,经过36氪授权发布。
