庆祝OpenAI十周年,震撼发布GPT-5.2,奥特曼预言:十年后迎接超级智能时代!

最近,OpenAI在竞争对手像谷歌的压力下,匆匆推出了他们的最新力作——GPT-5.2,正好在他们成立十周年之际。

在12月11日这一天,OpenAI正式发布了GPT-5.2模型。根据他们的说法,这个模型特别适合专业领域的工作和长时间运行的智能体,算得上是目前最强大的专业知识工作模型系列。它在通用智能、长上下文理解、智能工具调用以及视觉方面都有了显著的提升,能够更好地执行复杂的现实任务。

这次的GPT-5.2分为Instant、Thinking和Pro三个版本,从今天开始,将逐步向付费用户推出。而对于已经在使用GPT-5.1的付费用户来说,他们可以继续使用三个月,之后就会停用。在API方面,所有开发者现在都可以访问了。

OpenAI的CEO山姆·奥特曼(Sam Altman)表示:“虽然没有新功能像生成精美文件那样酷炫,但GPT-5.2的升级感觉是我们很久没有体验到的巨大进步。”

据悉,GPT-5.2在很多基准测试中都取得了新的高分。在GDPval测试中(这是OpenAI设计的一个AI评估标准,专门用来测量最前沿模型在实际经济任务中的表现,以解决学术测试与实际应用之间的差距),它在44种职业的明确知识任务上超越了行业内的专业人士。

庆祝OpenAI十周年,震撼发布GPT-5.2,奥特曼预言:十年后迎接超级智能时代!

在GDPval测试中,Thinking版的GPT-5.2在70.9%的比较中都战胜或持平顶尖行业专家。

在编码能力方面,GPT-5.2的Thinking版在SWE-Bench Pro(这是对实际软件工程的严格评估,测试四种编程语言,强调抗污染性、挑战性和多样性)上取得了55.6%的最高成绩,而在SWE-bench Verified上,Thinking版的得分也达到了80%。

庆祝OpenAI十周年,震撼发布GPT-5.2,奥特曼预言:十年后迎接超级智能时代!

OpenAI表示,这意味着这个模型在日常专业使用中,能够更稳妥地调试生产代码、响应功能请求、重构大型代码库,甚至能在更少人工干预的情况下,顺畅完成修复。

在前端软件开发方面,GPT-5.2的Thinking版明显优于GPT-5.1。早期用户发现它在前端开发和复杂的UI工作(尤其是涉及3D元素的任务)方面展现了更强的能力,比如制作海洋波浪模拟、节日贺卡制作器和打字游戏等。

GPT-5.2 Thinking在事实准确性、长上下文处理、视觉理解和工具调用性能上都有了很大的提升。与GPT-5.1 Thinking相比,它的幻觉现象减少了30%;在4-needle MRCR变体(长达256k token)任务中,准确率几乎达到了100%。同时,对于需要超出最大上下文窗口的任务,GPT-5.2 Thinking能与OpenAI的新Responses /compact端点兼容,扩展了模型的有效上下文窗口。在视觉能力方面,GPT-5.2 Thinking成为OpenAI迄今为止最强大的视觉模型,图表推理和软件界面理解的错误率减半,理解图像中元素的定位能力也大大增强;在工具调用性能上,GPT-5.2 Thinking在Tau2-bench Telecom测试中取得了98.7%的得分,对于延迟敏感的场景,其表现也远超GPT-5.1和GPT-4.1。

庆祝OpenAI十周年,震撼发布GPT-5.2,奥特曼预言:十年后迎接超级智能时代!

这就是GPT-5.2和GPT-5.1在视觉能力上的对比。

在科学和数学能力方面,GPT-5.2 Pro在GPQA Diamond(这是一个针对研究生水平的问答基准)测试中达到了93.2%,而Thinking版则获得了92.4%。

OpenAI还提到,在最近与GPT-5.2 Pro合作的一项研究中,研究人员探索了统计学习理论中的一个开放性问题。在特定的设定下,模型不仅提出了一个证明,还得到了作者的验证,并与外部专家共同进行了审查,这一过程证明了最前沿模型在严格的人类监督下能协助进行数学研究。

OpenAI十周年:回顾与展望,GPT-5.2的突破性进展

最近,GPT-5.2 Pro在ARC-AGI 1测试中表现出色,成为首个突破90%这一大关的模型,较去年o3-preview的87%进步明显。同时,它的成本也降到了之前的1/390,真是个了不起的成就!

在更具挑战性的ARC-AGI-2基准测试中,GPT-5.2 Thinking的得分为52.9%,而GPT-5.2 Pro更是达到了54.2%。这显示出模型在流体推理和抽象问题解决上的能力有了进一步的提升。

值得一提的是,这一天恰好是OpenAI成立十周年,奥特曼发布了一篇名为《十年》的博客,回顾了这十年来公司的成就、经验和对AGI的思考。

他感慨,OpenAI的成就已经超出了他当初的预期,“我们设定的目标是疯狂的、几乎不可能实现的。从一开始的种种不确定,到如今的进展,虽然希望渺茫,但我们始终在努力,现在看来,我们有望实现我们的使命。”

奥特曼回忆起早期的合影,首先被大家的年轻和乐观所震撼。“那段日子真是疯狂又快乐,尽管我们常常遭到误解,但我们始终相信这项事业的重要性,即使成功的机会微乎其微,我们也愿意为之付出努力。我们的团队才华横溢,目标明确。”

庆祝OpenAI十周年,震撼发布GPT-5.2,奥特曼预言:十年后迎接超级智能时代!

OpenAI在十周年视频中发布的创业早期照片。

他还提到,三年前ChatGPT发布时,吸引了全球的目光,而GPT-4的推出更是引发了疯狂的反响。从那时起,通用人工智能(AGI)的概念再也不是个疯狂的想法。“过去三年充满了压力和责任,这项技术以前所未有的速度和规模进入了我们的生活。为了应对这一切,我们需要极高的执行力,快速建立全新的能力。从无到有,建立这样一家庞大的公司并非易事,每周都要做出无数决策。我为团队能够做出很多正确的决策感到骄傲,而那些错误的决定,基本上都是我的责任。”

奥特曼表示,从未对OpenAI的研究、产品路线以及朝着使命的方向感到如此乐观。他相信,十年后,OpenAI将能创建出超级智能。“我对未来充满期待;在某种程度上,日常生活和我们关心的事情变化不大,但我相信,2035年的人们将能做一些我们现在难以想象的事情。”

澎湃新闻记者 秦盛

(本文来自澎湃新闻,更多原创资讯请下载“澎湃新闻”APP)

来源:今日头条
原文标题:OpenAI十周年,火速发布GPT-5.2,奥特曼:十年后将构建出超级智能 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论