“GPT-5.2荣膺‘打工人之王’，谷歌Gemini系列强势回击！”

图片由AI生成

“说实话，我从未像现在这样对我们的研发和产品方向感到这么乐观。”

在12月12日，OpenAI的CEO萨姆·奥尔特曼（Sam Altman）在推出GPT-5.2的同时，发表了一篇庆祝公司十周年的文章。

他努力传递出自己依旧充满信心的态度。毕竟，尽管GPT大模型和ChatGPT聊天机器人在AI领域依然占据领导地位，但我想此时的奥尔特曼内心的竞争压力绝对是空前的。

今年以来，DeepSeek、Grok、Claude等对手的快速追赶，尤其是谷歌上个月推出的Gemini 3，都让AI大模型的竞争变得更加激烈。

不久前，奥尔特曼在公司内部备忘录中提醒员工，得接受大模型不一定都是自家开发的这个现实，接着，他还发出了公司首个“红色警报”，强调“必须立刻行动，集中所有资源抢回领先优势”。

“GPT-5.2荣膺‘打工人之王’，谷歌Gemini系列强势回击！”

截图来自社交平台X

只有更强大的产品才能支撑起这种自信。

在十周年纪念日这天，OpenAI重磅推出了备受期待的GPT-5.2，测试结果再次超越了所有竞争对手。

但谷歌也不甘示弱，几乎在同一时间推出了新产品，让这场大模型之争的竞争变得更加白热化。

GPT-5.2被评为“最强AI打工人”，但“工资”也不便宜

这次GPT-5.2依旧“全力以赴”，一次性发布了Instant、Thinking和Pro三个不同级别的模型。

一个月前Gemini 3发布时，其评测得分几乎是“碾压”GPT-5的表现，引起市场的广泛关注。

而这次，根据OpenAI发布的基准测试结果，GPT-5.2实现了全面反超，其Thinking模型的测试得分均高于Gemini 3 PRO和Anthropic的Claude Opus 4.5。

特别是，GPT-5.2在博士级别的专家推理评估GPQA Diamond中得分高达92.4%，相比于GPT-5.1 Thinking的88.1%和Gemini 3 PRO的91.9%又有了显著提升。在不使用工具的情况下，GPT-5.2在最新的美国数学邀请赛（AIME2025）中获得了满分。

OpenAI特别强调了GPT-5.2在专业工作方面的优势，称其Thinking模型是“当前最适合各种专业用途的模型”。

在用于评估专业技能的GDPval测试中，该模型得到了70.9%的高分，比GPT-5.1 Thinking高出32.1%，领先Gemini 3 PRO则有17.4%。而且在编程等企业工作中，之前表现更佳的Claude Opus 4.5，GPT-5.2也超过了11.3%。

“GPT-5.2荣膺‘打工人之王’，谷歌Gemini系列强势回击！”

图片来自OpenAI

OpenAI展示的案例中，GPT-5.2专注于制作表格、数据整理分析、项目流程图等非常实用的工作场景。

公司还表示，这款新模型在编写代码、制作PPT、图像感知、理解长上下文、使用工具以及处理复杂的多步骤项目方面都表现得相当出色，错误率也比前代产品大幅减少。

模型发布后，GPT-5.2在实际工作应用中的表现得到了很多好评，用户甚至称其为“最强AI打工人”“职场最佳拍档”等。

不过，这个“打工人”的“高工资”可能会成为一个问题。

数据显示，GPT-5.2的输入输出成本比前代增加了40%，输入价格为21美元，输出价格则高达168美元。

这引发了一些担忧，之前OpenAI通过增加算力来发展大模型的做法已受到质疑，无论是DeepSeek还是Gemini，似乎都证明了AI应用可以采用更高性价比的模式。

再加上市场对以OpenAI和英伟达等引领的资本支出狂潮的警惕，以及对泡沫的焦虑，GPT-5.2如果真是靠算力“硬碰硬”来实现反击，显然也是奥尔特曼需要考虑的隐忧。

谷歌给OpenAI送上了一记重击，提前一小时发布Gemini Deep Research

说实话，OpenAI的竞争对手们早已蓄势待发，准备对这次GPT的重大更新进行反击。

就在GPT-5.2发布前约一个小时，谷歌更新了他们的产品，宣布Gemini Deep Research全面升级，并首次向开发者开放。这一举动引起了不少关注，显然谷歌不想让OpenAI独占风头。

根据谷歌的说法，Gemini Deep Research是基于Gemini 3 PRO开发的，经过多步强化学习训练，显著减少了“幻觉”现象，在处理复杂研究任务时表现得更加准确。

在被称为人类终极大考（HLE）的测试中，Gemini Deep Research得分为46.4%，比GPT-5.2 Thinking的45.5%高出不少，仅次于GPT-5 Pro的50%。

“GPT-5.2荣膺‘打工人之王’，谷歌Gemini系列强势回击！”

图片

不过，更让人惊讶的是它的成本。谷歌的产品经理透露，新的智能体在功能上与GPT-5 Pro相当，但成本仅为其十分之一，这种高性价比的优势可不是随便能遇到的。

相比OpenAI，谷歌如今的竞争力在于更高的性价比、独特的训练模式、稳定的现金流和自家的专用芯片，这些都为谷歌的崛起提供了有力的支持。

现在，在大模型的较量中，谷歌的优势依旧明显，这给OpenAI带来了不小的压力。

而且，谷歌还同步开源了基准测试工具DeepSearchQA，涵盖了17个领域的900个复杂任务，以便更科学地评估研究型智能体的能力。

当然，GPT-5.2未必是奥尔特曼保住大模型霸主地位的终极武器。

据说，OpenAI正在加快开发全新的“Garlic”模型，力求以新的方式重塑领先优势。谷歌和Anthropic显然也会继续推出更优秀的产品，而Meta和DeepSeek等竞争者也有不少让人期待的新产品即将面世。

在这场大模型的竞争中，英伟达最近与美银进行了投资者的线上交流会，提到基于Gemini 3的表现优于GPT-5的说法，并不合理，因为大部分模型都是用上一代H系列芯片训练的。用新一代的Blackwell芯片训练的模型要到2026年才会投入使用，届时才能显现优势，更别提尚未投入使用的超级芯片Rubin了。

市场对英伟达的观点褒贬不一，有些人认为模型的强大和芯片的代际关系不大，而另一些则认为性价比才是核心。不过，无论如何，英伟达的言论让我们对明年的大模型竞争充满期待。

到了2025年年底，AI大模型和AI芯片的竞争将更加激烈，预计2026年战况将持续升级。这场战斗不仅是关于大模型性能的较量，更是关于训练和发展路径，以及AI芯片未来的较量。（作者｜胡珈萌，编辑｜李程程）

来源：今日头条

原文标题：GPT-5.2获封“最强打工人”，谷歌同日以Gemini“性价比”系列应战 – 今日头条

原文链接：https://www.toutiao.com/article/7582881950219420202/

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！