GPT-5.2强势来袭!OpenAI称其智能体编码超越人类专家,Altman预计明年将解除“红色警报”!

编辑:杜宇

就在12月11日,美国的开放人工智能研究中心(OpenAI)发布了他们最新的人工智能模型——GPT-5.2,这一举动是为了在竞争日益激烈的生成式人工智能领域中保持领先。

GPT-5.2强势来袭!OpenAI称其智能体编码超越人类专家,Altman预计明年将解除“红色警报”!

图片

为了应对谷歌在11月推出的双子座3模型的强劲表现,OpenAI的CEO萨姆·奥尔特曼不久前发出了“红色警报”,加速发布GPT的新版本。

今年8月,OpenAI推出了GPT-5,紧接着在11月发布了GPT-5.1,而现在不到一个月又带来了新版本。这一系列动作显示出人工智能行业的竞争压力确实不小。

GPT-5.2强势来袭!OpenAI称其智能体编码超越人类专家,Altman预计明年将解除“红色警报”!

图片

最新的GPT-5.2被认为是OpenAI迄今为止最先进的人工智能模型,特别是在专业领域进行了全面的优化,创造了多个基准测试的新纪录。其中,GPT-5.2 Thinking在SWE编码能力测试中获得了历史最高分,它的表现甚至达到了或超越了人类专家的水平。

OpenAI表示,GPT-5.2在“专业知识工作方面”表现非常出色,特别是在制作电子表格、演示文稿、图像理解、编码以及处理复杂上下文等方面,都明显超过了以往的版本。研究副总裁Adain Clark提到,GPT-5.2在数学推理方面的提升,让它在金融建模、预测和数据分析等任务中表现更加出色。

在12月11日,GPT-5.2已经在ChatGPT平台上线,供Plus、Pro、Go、Business和Enterprise等付费用户使用,并推出了Instant、Thinking和Pro三个版本,API也对所有开发者开放。

在ChatGPT中,付费用户可以使用这三个版本的GPT-5.2,同时在接下来的三个月内还可以继续使用GPT-5.1。而在API平台上,GPT-5.2的定价是每百万输入token 1.75美元、每百万输出token 14美元,输入缓存可享受90%的折扣。虽然单个token的价格比GPT-5.1高,但由于模型的效率更高,达到相同质量的总体成本反而更低。

三个版本GPT-5.2各具特色

OpenAI介绍说,Instant是一个快速高效的日常工作和学习助手,能够在信息查询、操作指南、技术写作和翻译等方面显著提升,并且保持了GPT-5.1 Instant中的亲切对话风格。早期测试者特别指出,GPT-5.2的解释更加清晰,能直接传达关键信息。

Thinking版本专为深度工作的需求而设计,帮助用户高效完成复杂任务,特别是在编码、总结长文档、回答上传文件相关问题、逐步进行数学和逻辑运算、以及提供更清晰框架和有用细节以辅助规划和决策等方面。

至于Pro版本,则是解决高难度问题时“最智能、最可靠”的选择。早期测试表明,在编程等复杂领域,它的表现更为出色,且重大错误的发生率明显降低。

性能全面领先,多项基准测试创新高

在多项关键基准测试中,GPT-5.2刷新了行业纪录。在GDPval测试中,这个模型在覆盖44个职业的知识工作任务上,70.9%的表现达到了行业专家的水平。OpenAI表示,GPT-5.2 Thinking完成这些任务的速度超过专家的11倍,而成本仅为专家的1%。

GPT-5.2强势来袭!OpenAI称其智能体编码超越人类专家,Altman预计明年将解除“红色警报”!

在编码能力方面,GPT-5.2 Thinking在SWE-Bench Pro上取得了55.6%的成绩,而在SWE-bench Verified上更是达到了80%的新高。这一基准测试反映了真实世界中的软件工程任务,涵盖了四种编程语言。OpenAI的产品负责人Max Schwarzer表示,GPT-5.2在代码生成和调试方面取得了显著进展,Windsurf和CharlieCode等初创公司都表示,该模型展现了“最先进的智能体编码性能”。

OpenAI最新发布:GPT-5.2全新升级,科学研究助手更强大

OpenAI最近自信地宣布,GPT-5.2 Thinking被誉为“全球最强的视觉模型”,在图表推理和软件界面理解方面的错误率几乎降低了一半。这款模型在处理长文本时表现尤为出色,在OpenAI的MRCRv2测试中,覆盖了25.6万token的范围,准确率接近100%,这让它特别适合用于深入的文档分析和多源信息处理。

在科学研究领域,GPT-5.2 Pro在GPQA Diamond测试中取得了93.2%的准确率,而GPT-5.2 Thinking也不甘示弱,紧随其后达到了92.4%。在数学测试FrontierMath中,GPT-5.2 Thinking还以解决40.3%的问题创下新高。OpenAI自信地称这两款模型是“全球顶尖的科学助手”。

对于谷歌来说,这次的GPT-5.2发布可以说是OpenAI的一次有力反击。

在12月11日,公司CEO Altman透露,用户们可期待下周的一些“小圣诞礼物”,他还提到,Gemini 3对公司业绩的影响比他们之前的担忧要小。此外,他表示OpenAI预计将在2026年1月“强势回归”目前的红色警报状态

GPT-5.2强势来袭!OpenAI称其智能体编码超越人类专家,Altman预计明年将解除“红色警报”!

此外,OpenAI的首席产品官Fidji Simo在12月11日也分享了一个新消息,他们已经在部分地区推出了年龄估算系统,这个系统的目的在于对18岁以下用户的回复进行内容控制。Simo还提到,公司希望在明年第一季度推出“成人模式”之前,先引入这个功能。

有传闻称,OpenAI计划在明年1月推出一款新模型,具备更强的图像处理能力和更出色的个性化特征,尽管公司方面对于这一消息并未正式确认。

每日经济新闻综合公开消息

每日经济新闻

来源:今日头条
原文标题:GPT-5.2来了!OpenAI称其为智能体编码最强,赶超人类专家!Altman料明年1月解除“红色警报”状态 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《GPT-5.2强势来袭!OpenAI称其智能体编码超越人类专家,Altman预计明年将解除“红色警报”!》有8条评论

  1. GPT-5.2的发布真是个令人兴奋的消息!从各个专业领域的优化来看,这个版本的性能令人期待,尤其是在编码和数学推理方面的提升,未来可能会大大改变我们工作的方式。

    回复
  2. GPT-5.2的强劲表现让人期待,特别是在专业领域的优化方面,似乎确实能达到人类专家的水平,未来在工作中的应用会更加广泛。

    回复
  3. OpenAI的GPT-5.2真是个突破,特别是在编码和数学推理上,能超越人类专家的能力让人惊叹,未来的应用前景非常广阔。

    回复
  4. GPT-5.2的性能提升非常明显,尤其是在数据分析和金融建模方面的应用,未来真的可以改变很多行业的工作方式。

    回复
  5. GPT-5.2的发布标志着人工智能领域的又一次飞跃,尤其是在处理复杂任务和提供清晰信息方面,确实让人印象深刻。期待它如何改变我们的工作方式。

    回复
  6. GPT-5.2的推出让人感到惊喜,尤其是在处理复杂任务和提供关键信息的能力上,确实提升了工作效率,期待它能够帮助更多行业优化流程。

    回复
  7. GPT-5.2的优化真是令人惊喜,尤其在处理复杂上下文和编码能力上,表现超越人类专家让人印象深刻,未来的应用潜力巨大。

    回复
  8. GPT-5.2的发布真是突破性的进展,特别是在专业知识工作上的表现,让我对未来的人工智能应用充满期待。这个版本的高效性和准确性将显著提升工作效率。

    回复

发表评论