全新GPT-5.2震撼登场,专业知识工作模型的巅峰之作!

在2025年12月12日,阿强分享了一个消息:就是在这一天,OpenAI悄然推出了三个新模型,分别叫做GPT-5.2 Instant、Thinking和Pro。

全新GPT-5.2震撼登场,专业知识工作模型的巅峰之作!

有意思的是,他们没有提前放出消息,也没开发布会。内部员工透露,这些模型是在“红色代码”状态下匆忙完成的。不过,官方却表示这并不是为了赶超谷歌的Gemini 3 Pro,而是资源集中的自然结果。听起来就像在游戏中突然开了外挂一样,轻松把对手甩在了身后。

全新GPT-5.2震撼登场,专业知识工作模型的巅峰之作!

说到这个新版本,它在执行任务时变得更加稳定和精准。以前,GPT-5.1在做股权结构表的时候会搞错清算优先权,公式也常常放错地方,还留了不少空白。而现在的GPT-5.2 Thinking可以一次性顺利完成任务,逻辑清晰,还能追溯每一步的来龙去脉。在实际测试中,它连ERP排班、医疗护理调度和制造流程图都能轻松搞定,格式也很规范。这可不是简单的查资料工具,而是能当你工作伙伴的存在。

全新GPT-5.2震撼登场,专业知识工作模型的巅峰之作!

编程能力的提升也非常显著。在工业级的SWE-Bench Pro测试中,它获得了55.6分,位居全球第一。而在Python专项测试中,合格率达到了80%。有时候只需给它一句提示,它就能做出一个调节风速和波高的海洋模拟网页,界面美观且运行流畅。我自己也试过写代码,知道这过程得花不少时间调试,而现在AI一个小时就能搞定,人只需简单检查一下就行了。

全新GPT-5.2震撼登场,专业知识工作模型的巅峰之作!
标题:AI新进展:从助手到项目执行者,你准备好了吗?

现在的技术基础真是越来越强大,想想吧,上下文窗口都扩展到了40万个token,输出能力更是达到12.8万个token,这样一来,处理整本合同或多轮会议记录都不成问题。而且知识更新到了2025年8月底,最新的法规和市场动态它都能掌握。更有意思的是,新增加的推理token机制,让它能够进行复杂的推演,比如财务建模中的嵌套变量依赖关系,以前我们得手动搭建表格,现在它能自己搞定这些关系,真是太方便了。

虽然现在价格涨了,但值不值得就看你怎么用了。你知道吗,输入输出的费用比之前贵了40%,而算力成本也一路飙升。OpenAI的研究员Yu Bai提到,这次更新可不是小打小闹,而是能力上的大飞跃。AI已经不再仅仅是帮你查资料的工具,而是能直接替你干活,真的从助手变成了执行者,甚至可以独立完成一些项目。

全新GPT-5.2震撼登场,专业知识工作模型的巅峰之作!

当然,和其他模型相比,GPT-5.2 Pro也不是无所不能的。在LMArena的代码榜单上,它屈居第二,稍微被Claude Opus 4.5超过。不过在通用智力测试ARC-AGI-2中,GPT-5.2 Pro可是拿到了52.9%的高分,稳居第一。虽然谷歌的Gemini 3 Pro在多模态处理上稍有优势,但在专业任务的稳定性上,还不如GPT-5.2 Pro来得可靠。可以说,Gemini适合做视频图像类的工作,而GPT-5.2 Thinking更擅长报表、写代码和数据分析。

企业用户已经开始享受到这些新技术带来的好处了。比如,会计可以自动生成合并报表和现金流模型;产品经理可以一键制作带动效的PPT;程序员则能够用AI修复Git缺陷和编写单元测试。投行分析师的建模得分提高了9.3分,错误率也大幅下降,以前平均每天能节省40到60分钟,现在可能节省的时间更多。其实,关键不在于人会不会失业,而是要学会如何和AI协作。专家定方向,AI则来执行,这很可能会成为未来的常态。

全新GPT-5.2震撼登场,专业知识工作模型的巅峰之作!

说实话,这种快速的进步难免让人有些紧张。不过想想也很正常,技术总是在不断向前发展,关键还是看人们如何利用它。有的人用它来刷短视频消遣,有的人则借它修改简历找工作,还有人干脆把它当成员工来使唤。与其总是担心被替代,不如多学会怎么指挥它干活。毕竟再强大的工具,也得人来掌握。

来源:今日头条
原文标题:GPT-5.2来袭,迄今为止功能最强大的专业知识工作模型系列! – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论