奥特曼出手,GPT-5.2被彻底击败!OpenAI推出终极编程AI!

嘿,听说过GPT-5.2-Codex吗?它最近可是深夜登场的哦!

这是OpenAI推出的最新一代AI编程助手,号称是目前最强大的智能体,专门为复杂的软件开发需求设计的。

奥特曼出手,GPT-5.2被彻底击败!OpenAI推出终极编程AI!

从名字上看,GPT-5.2-Codex是基于GPT-5.2的升级版,它在多个方面都有了显著的提升:

·优秀的上下文压缩,让它在处理长周期任务时更给力

·在大规模代码修改,比如重构和迁移上,表现得更为强劲

·在Windows环境下的编程能力也得到了大幅度增强

·在网络安全方面的能力更是出类拔萃

听说「OpenAI」团队已经开始使用这个新工具,并且取得了非常不错的效果。

奥特曼出手,GPT-5.2被彻底击败!OpenAI推出终极编程AI!

在一系列的基准测试中,GPT-5.2-Codex在软件开发和终端测试方面表现超越了5.1-Codex-Max、GPT-5.2和GPT-5.1。

奥特曼出手,GPT-5.2被彻底击败!OpenAI推出终极编程AI!

OpenAI的博客也多次提到,GPT-5.2-Codex在网络安全方面已经达到了前所未有的高度。

就在上周,有位安全研究员利用GPT-5.1-Codex-Max和Codex CLI,揭露了一个导致React源代码泄露的漏洞。

奥特曼出手,GPT-5.2被彻底击败!OpenAI推出终极编程AI!

从今天开始,所有付费用户都能体验到GPT-5.2-Codex,未来几周内API也会开放。

GPT-5.2-Codex编程实力大增,稳定性更佳

这款全新的AI编程助手GPT-5.2-Codex,简单来说就是一次「强强联手」。

它不仅保留了GPT-5.2在专业工作处理上的优势,还吸收了5.1-Codex-Max在编程和终端操作方面的能力。

这样一来,它的能力提升就显而易见了——

在长上下文理解、工具调用、准确性、原生上下文压缩等多个方面,都得到了显著的进步。

因此,GPT-5.2-Codex可以更稳定地支持长时间的编程任务,同时在推理过程中也能更加节省token。

AI技术飞跃,编程助手更强大

最近在行业的基准测试中,5.2-Codex在SWE-Bench Pro和Terminal-Bench 2.0这两个项目上取得了新的顶尖成绩。

和5.1-Codex相比,它的性能提升了大约6%。

奥特曼出手,GPT-5.2被彻底击败!OpenAI推出终极编程AI!

这两项测试专门用来评估模型在实际环境中处理各种任务时的表现。

而且,在原生Windows环境下,智能体编程的表现也有了显著的提升,进一步加强了GPT-5.1-Codex-Max带来的能力。

这些优化让Codex能够在大型代码库中长时间高效作业,同时保持上下文的完整性。

这意味着,对于重大重构、代码迁移和功能开发等复杂任务,GPT-5.2-Codex都能稳定地完成。

就算在过程中需要调整方案或遇到失败,它也能继续改进而不迷失方向。

更让人惊喜的是,GPT-5.2-Codex的“视力”提升了。

在编程时,直接给它发截图、技术示意图、图表或各种UI界面,它都能理解得更加准确。

奥特曼出手,GPT-5.2被彻底击败!OpenAI推出终极编程AI!

更厉害的是,它可以直接解析设计图,并迅速将其转化为可运行的功能原型。

开发者还可以和Codex一起合作,逐步完善这些原型,直到它们可以正式上线。

三次突破,AI打入现实世界

在OpenAI的一项重要网络安全评估中,可以清晰地看到“能力随时间的提升”——

·GPT-5-Codex带来了首次显著的进步,

·GPT-5.1-Codex-Max实现了第二次飞跃,

·而GPT-5.2-Codex则完成了第三次跨越。

奥特曼出手,GPT-5.2被彻底击败!OpenAI推出终极编程AI!

因此,OpenAI预测,未来的AI模型将继续沿着这个趋势不断演变。

在进行发展规划和能力评估时,他们一直认为每一代模型都有潜力达到“准备框架”(Preparedness Framework)中定义的“高级”网络安全能力。

不过,目前GPT-5.2-Codex还没达到这个标准。

那么,在现实世界中,OpenAI的智能体编程模型表现如何呢?

一周内发现React的高危漏洞

12月11日,React团队曝光了三个有关React Server Components的安全漏洞。

随后,Stripe旗下的Privy公司的首席安全工程师Andrew MacPherson决定用这个漏洞来“测试”一下当前的AI模型到底有多牛。

他同时使用了GPT-5.1-Codex-Max和Codex CLI,还有其他编程智能体,意外地在复现和研究漏洞的过程中,成功挖掘出了关键的React漏洞。

深入探索AI漏洞发现的过程

我们来聊聊这个过程是怎么进行的吧——

一开始,他尝试用零样本学习的方法,让模型自己去找补丁修复的漏洞类型,但结果并不理想。

接着,他开始用更频繁、迭代的提示方式,然而这些方法也没能奏效。于是,他决定让Codex按照正规的安全防护流程来进行操作——搭建一个本地测试环境,分析可能被攻击的地方,然后通过模糊测试往系统里注入一些奇怪的输入。

在复现React2Shell问题的过程中,Codex发现了一些异常现象,值得深入研究。

最终,经过短短一周的努力,这个流程让一个之前未被发现的漏洞浮出水面,并以负责任的方式告知了React团队。

这个案例很好地展示了,先进的AI系统是如何大幅提升现实中广泛使用软件的安全研究效率的。

网友实测

一位开发者尝试用GPT-5.2-Codex来编写一个模拟车辆与交通灯互动的程序,但结果却没有成功。

不过,有人认为它的动画效果与Gemini 3 Flash和Pro相比也不遑多让。

AI新突破:GPT-5.2-Codex助力游戏开发与网络安全

最近,GPT-5.2-Codex在开发一款反恐精英游戏时,表现得相当出色,真的让人刮目相看。

说到这个新发布的模型,OpenAI可谓是满怀期待。他们认为,GPT-5.2-Codex的推出,标志着在真实软件开发和网络安全领域又迈出了重要一步。

这款工具不仅让开发者在处理那些复杂、耗时的任务时变得轻松了许多,还为网络安全的研究提供了更强大的支持,简直是个好帮手!

参考资料:

https://openai.com/index/introducing-gpt-5-2-codex/

https://openai.com/index/gpt-5-2-codex-system-card/

本文摘自微信公众号“新智元”,作者:新智元,编辑:桃子 好困,经过36氪授权发布。

来源:今日头条
原文标题:太狠了,奥特曼亲手「干掉」GPT-5.2,OpenAI祭出最强编程AI – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论