GPT-5.2强势来袭！OpenAI称其智能体编码超越人类专家，Altman预计明年将解除“红色警报”！

编辑：杜宇

就在12月11日，美国的开放人工智能研究中心（OpenAI）发布了他们最新的人工智能模型——GPT-5.2，这一举动是为了在竞争日益激烈的生成式人工智能领域中保持领先。

GPT-5.2强势来袭！OpenAI称其智能体编码超越人类专家，Altman预计明年将解除“红色警报”！

图片

为了应对谷歌在11月推出的双子座3模型的强劲表现，OpenAI的CEO萨姆·奥尔特曼不久前发出了“红色警报”，加速发布GPT的新版本。

今年8月，OpenAI推出了GPT-5，紧接着在11月发布了GPT-5.1，而现在不到一个月又带来了新版本。这一系列动作显示出人工智能行业的竞争压力确实不小。

GPT-5.2强势来袭！OpenAI称其智能体编码超越人类专家，Altman预计明年将解除“红色警报”！

图片

最新的GPT-5.2被认为是OpenAI迄今为止最先进的人工智能模型，特别是在专业领域进行了全面的优化，创造了多个基准测试的新纪录。其中，GPT-5.2 Thinking在SWE编码能力测试中获得了历史最高分，它的表现甚至达到了或超越了人类专家的水平。

OpenAI表示，GPT-5.2在“专业知识工作方面”表现非常出色，特别是在制作电子表格、演示文稿、图像理解、编码以及处理复杂上下文等方面，都明显超过了以往的版本。研究副总裁Adain Clark提到，GPT-5.2在数学推理方面的提升，让它在金融建模、预测和数据分析等任务中表现更加出色。

在12月11日，GPT-5.2已经在ChatGPT平台上线，供Plus、Pro、Go、Business和Enterprise等付费用户使用，并推出了Instant、Thinking和Pro三个版本，API也对所有开发者开放。

在ChatGPT中，付费用户可以使用这三个版本的GPT-5.2，同时在接下来的三个月内还可以继续使用GPT-5.1。而在API平台上，GPT-5.2的定价是每百万输入token 1.75美元、每百万输出token 14美元，输入缓存可享受90%的折扣。虽然单个token的价格比GPT-5.1高，但由于模型的效率更高，达到相同质量的总体成本反而更低。

三个版本GPT-5.2各具特色

OpenAI介绍说，Instant是一个快速高效的日常工作和学习助手，能够在信息查询、操作指南、技术写作和翻译等方面显著提升，并且保持了GPT-5.1 Instant中的亲切对话风格。早期测试者特别指出，GPT-5.2的解释更加清晰，能直接传达关键信息。

Thinking版本专为深度工作的需求而设计，帮助用户高效完成复杂任务，特别是在编码、总结长文档、回答上传文件相关问题、逐步进行数学和逻辑运算、以及提供更清晰框架和有用细节以辅助规划和决策等方面。

至于Pro版本，则是解决高难度问题时“最智能、最可靠”的选择。早期测试表明，在编程等复杂领域，它的表现更为出色，且重大错误的发生率明显降低。

性能全面领先，多项基准测试创新高

在多项关键基准测试中，GPT-5.2刷新了行业纪录。在GDPval测试中，这个模型在覆盖44个职业的知识工作任务上，70.9%的表现达到了行业专家的水平。OpenAI表示，GPT-5.2 Thinking完成这些任务的速度超过专家的11倍，而成本仅为专家的1%。

GPT-5.2强势来袭！OpenAI称其智能体编码超越人类专家，Altman预计明年将解除“红色警报”！

在编码能力方面，GPT-5.2 Thinking在SWE-Bench Pro上取得了55.6%的成绩，而在SWE-bench Verified上更是达到了80%的新高。这一基准测试反映了真实世界中的软件工程任务，涵盖了四种编程语言。OpenAI的产品负责人Max Schwarzer表示，GPT-5.2在代码生成和调试方面取得了显著进展，Windsurf和CharlieCode等初创公司都表示，该模型展现了“最先进的智能体编码性能”。

OpenAI最新发布：GPT-5.2全新升级，科学研究助手更强大

OpenAI最近自信地宣布，GPT-5.2 Thinking被誉为“全球最强的视觉模型”，在图表推理和软件界面理解方面的错误率几乎降低了一半。这款模型在处理长文本时表现尤为出色，在OpenAI的MRCRv2测试中，覆盖了25.6万token的范围，准确率接近100%，这让它特别适合用于深入的文档分析和多源信息处理。

在科学研究领域，GPT-5.2 Pro在GPQA Diamond测试中取得了93.2%的准确率，而GPT-5.2 Thinking也不甘示弱，紧随其后达到了92.4%。在数学测试FrontierMath中，GPT-5.2 Thinking还以解决40.3%的问题创下新高。OpenAI自信地称这两款模型是“全球顶尖的科学助手”。

对于谷歌来说，这次的GPT-5.2发布可以说是OpenAI的一次有力反击。

在12月11日，公司CEO Altman透露，用户们可期待下周的一些“小圣诞礼物”，他还提到，Gemini 3对公司业绩的影响比他们之前的担忧要小。此外，他表示OpenAI预计将在2026年1月“强势回归”目前的红色警报状态。

GPT-5.2强势来袭！OpenAI称其智能体编码超越人类专家，Altman预计明年将解除“红色警报”！