嘿,大家好!你知道吗?OpenAI最近在12月18日发布了GPT-5.2-Codex,距离他们推出GPT-5.2系列才不过一周。这一举动真是让人眼前一亮,毕竟他们需要在与谷歌的Gemini模型竞争中保持领先。而这款新发布的模型,算是OpenAI迄今为止最强大的编码模型,专为专业软件开发和网络安全设计,结合了更强的长时间任务处理能力和显著增强的网络安全功能,这样的组合既带来了机遇,也潜藏着风险。

AI生成的图像
好消息是,付费的ChatGPT用户现在可以在所有Codex平台上立即使用这个模型,API访问预计在接下来的几周内也会开放。OpenAI表示,GPT-5.2-Codex在进行大规模代码更改,如重构和迁移时表现尤为出色,在Windows环境下的表现更佳,并且在持续编码过程中引入了改进的上下文压缩。
在网络安全方面,这个新模型的能力也有显著提升。虽然在OpenAI的准备框架下,GPT-5.2-Codex的能力没有达到“高”的级别,但公司表示,他们预计很快会有模型突破这个门槛。CEO山姆·奥特曼还宣布,将为经过审核的安全专业人士和专注于网络安全的组织推出一个仅限邀请的信任访问试点。
OpenAI表示,他们在部署时非常注重安全性与可访问性的平衡,尤其是在能力快速增长的情况下。为了应对潜在的有害任务,他们实施了专门的安全培训、代理沙盒和可配置的网络访问。
顶尖的编码性能继续延续早期的优势
GPT-5.2-Codex在12月11日发布的GPT-5.2基础上进行了强化。当时OpenAI声称,这个模型达到了“顶尖的代理编码性能”,并认为GPT-5.2 Thinking是他们的最佳视觉模型。那次发布的得分为55.6%,标志着OpenAI首次有模型在专业任务上达到或超越人类专家的表现。
而这款新Codex版本更是将这些指标进一步提升。GPT-5.2-Codex在SWE-Bench Pro上的准确率达到了56.4%,超出了GPT-5.2的55.6%和GPT-5.1的50.8%。在Terminal-Bench 2.0测试中,GPT-5.2-Codex的得分为64.0%,相比之下,GPT-5.2为62.2%,GPT-5.1为58.1%。
这个模型在长上下文理解、工具调用的可靠性以及原生压缩方面都有所改善,使得它在处理复杂任务时,如大规模重构和代码迁移,能够更加高效。更强的视觉表现也让它在编码时对屏幕截图、技术图纸和用户界面的理解更为准确。
开发者平台如Windsurf、Cognition、Warp和JetBrains在12月11日发布GPT-5.2后也报告了顶尖的代理编码性能。Windsurf的CEO杰夫·王表示,GPT-5.2“代表了GPT模型在代理编码方面的最大飞跃”,它让脆弱的多代理系统能够整合为单一的超级代理,且拥有超过20个工具。
网络安全能力大幅提升,React漏洞浮出水面
OpenAI的GPT-5.2-Codex带来了迄今为止最强大的网络安全能力,随着GPT-5-Codex的发布,公司观察到性能大幅跃升,并在后续版本中进一步加速。在OpenAI的专业Capture-the-Flag评估中,该评估测量了需要专业水平网络安全技能的高级多步骤挑战,每个版本的能力都有明显提升。
在新模型发布之前,现实世界的影响就已经显现。12月11日,安全研究员安德鲁·麦克弗森利用GPT-5.1-Codex-Max和Codex CLI发现了三个之前未知的React漏洞,而React团队随后对此进行了公布。麦克弗森在复现一个名为React2Shell的早期漏洞时,模型意外地展现出了一些行为,促使他做出了新发现。
这位研究员引导Codex进行标准的防御工作流程,包括搭建测试环境、分析攻击面以及使用畸形输入进行模糊测试。OpenAI表示,这一事件展示了先进的人工智能系统如何加速防御性安全工作,同时也突显出这些帮助防御者的能力可能被恶意行为者滥用的风险。
阿尔特曼在X上发文称:“上周,一位安全研究员利用我们之前的模型发现并披露了一个可能导致源代码暴露的React漏洞。我相信这些模型对网络安全是一个净收益,但我们正处于‘实际影响阶段’,随着它们的改进,这一情况将会加剧。”
可信访问计划瞄准防御性安全
OpenAI正在开发一个仅限邀请的可信访问试点,旨在让符合条件的安全专业人士和组织利用前沿的人工智能网络能力进行防御工作。该计划的目标是消除安全团队在模拟威胁行为者、分析恶意软件以进行修复或对关键基础设施进行压力测试时遇到的限制。
首批参与者将包括那些拥有负责任漏洞披露记录的安全专业人士和具有清晰专业网络安全用例的组织。符合条件的参与者将获得使用OpenAI最强大模型进行防御性应用的权限,以促进合法的双重用途工作。
阿尔特曼在X上表示:“我们开始探索用于防御网络安全工作的可信访问计划。”他还提到:“Codex正在变得非常出色,并将迅速改善。如果你想帮助它在明年变得100倍更好,我们的团队正在招聘。保证是一次疯狂的冒险,成功的可能性很高。”
公司表示,其部署方法考虑了未来能力的增长,预计即将推出的人工智能模型将继续沿着当前的轨迹发展,朝着通过其准备框架测量的高级网络安全能力前进。GPT-5.2-Codex包含额外的模型级和产品级安全措施,具体内容详见更新的系统卡。
OpenAI表示,逐步推出结合了安全措施,并与安全社区紧密合作,旨在最大化防御效果,同时减少滥用风险。公司计划利用此次发布的经验来指导未来的扩大访问,随着软件和网络能力的进步而不断优化。

OpenAI的GPT-5.2-Codex真是个创新的里程碑,尤其在编程和网络安全领域的提升,令人期待它在实际应用中的表现。
GPT-5.2-Codex的发布无疑是对编程行业的巨大推动,尤其是在网络安全方面的加强,让人对未来的应用充满期待。
OpenAI的GPT-5.2-Codex在编码能力上有了显著提升,尤其是在处理复杂任务时表现出色,期待它在实际开发中的应用效果。
GPT-5.2-Codex的发布让我对AI在编程领域的未来充满信心,尤其是在网络安全的能力提升上,真是个值得关注的进展。
OpenAI的GPT-5.2-Codex在编码和网络安全方面的提升,真的为开发者带来了新的机遇,期待它能在实际项目中发挥更大作用。
OpenAI的GPT-5.2-Codex在编码性能和网络安全领域的增强,确实为开发者提供了更强大的工具,值得期待它在复杂项目中的应用效果。
GPT-5.2-Codex的发布真是令人振奋,尤其是在长时间任务处理和网络安全方面的提升,给开发者带来了更多可能性。期待它能在实际应用中发挥出色。