就在几天前的凌晨2点,OpenAI为了庆祝十周年,正式发布了他们的新版本——GPT-5.2。

最近,各大科技公司都在加速更新他们的模型。前不久,Google的Gemini 3 Pro一推出就引起了轰动,让GPT都显得逊色不少。再加上DeepSeek的V3.2更新,真是竞争激烈。
如今,我们终于迎来了GPT-5.2的到来。
那么,这次更新到底做了哪些改进呢?不妨看看官网的介绍。
这是目前在专业知识领域中最强的模型系列。
它还发布了最新的跑分,绝大多数测试集都得到了显著的提升,尤其是在AIME 2025中更是达到了100%的满分。

核心内容依旧是与之前的GPT-5.1、Gemini 3 Pro以及ClaudeOpus 4.5进行对比。
根据最新的用户反馈,GPT-5.2在3D效果上表现得相当出色。我们来看看用它搭建的网站效果。

这次的GPT-5.2还推出了几种不同的版本。
GPT-5.2 Thinking
这是对44个职业中明确规定的知识工作任务的评估,也是我们第一个能在专家水平上运行的模型。

GPT-5.2 Pro
这是个聪明得令人惊叹的难题解决工具:
– 在编程等复杂领域的表现更为卓越
– 有效协助科学家进行研究,提升效率
GPT-5.2 Instant
专为日常工作和学习而生:
– 热情且健谈,像GPT-5.1一样
– 关键信息更清晰易懂
– 操作指南和练习得到了改进
– 技术写作和翻译的能力也更强
—— 进一步支持学习和就业指导
说到GPT-5.2 Thinking为何被称为人类专家水平,我们得聊聊一个新的测试集GDPval。
这个新基准是通过实际经济任务来评估AI模型的表现,让人类专家来看看它干得如何。
官方的解释是:

简单来说,这个测试集是用来评估AI在真实经济环境中的表现,看看它在各行各业的工作能否达到人类专家的水平,涉及到设计师、建筑师、律师等44个职业的工作。
测试结果显示,相较于之前的模型有了显著提升。
来看看提升的对比吧!

之前的GPT-5 Thinking得分只有38%,而最新的Pro版本已经提高到74.1%,真的是个大进步!
看看官方发布的数据图表,效果比很多专业人士还要优秀呢。
让GPT来做个规划模型的汇报表吧!
AI模型的飞速进步,真让人惊喜!
这次的效果简直是提升了太多了!
总结一下
总体来看,这次的效果真是相当惊艳!GDPval可能会促使其他模型厂商也加快进度,AI的发展速度真是让人目不暇接,许多工作都可能会被它接替。
最后,网友们也在调侃,到底谁才是真正的最强模型呢?哈哈哈!
今天的分享就到这里啦~

GPT-5.2的发布真是个令人振奋的消息,尤其是在专业知识领域的表现,提升幅度太大了!未来AI在各行业的应用前景让人期待。
GPT-5.2的多版本设计真是贴心,特别是针对不同职业的需求,能大大提高工作效率,期待它的实际应用效果。
GPT-5.2在专家级任务中的表现让人刮目相看,尤其是与人类专家的对比结果,真是让人充满期待!
GPT-5.2的多版本策略非常有意思,能够针对不同职业的具体需求来优化表现,真正实现了专业化。这样的进步无疑会推动各行各业的效率提升。
GPT-5.2的进步真是让人惊叹,尤其是在经济任务的实际表现上,明显优于之前的版本。期待它能在各行各业带来更多创新!
GPT-5.2在各行业的专家任务上有了显著提升,尤其是在经济领域的表现,让人对未来的应用充满期待。这样的发展速度真是让人惊喜!
GPT-5.2的更新真是太令人振奋了,特别是在经济任务中的表现提升明显,未来在职场中的应用前景让人期待。
GPT-5.2的发布让人感到兴奋,特别是在职业评估方面的进步,真的是提升了不少。期待它在更多领域的实际应用!