“GPT-5.2荣膺‘打工人之王’,谷歌Gemini系列强势回击!”

“GPT-5.2荣膺‘打工人之王’,谷歌Gemini系列强势回击!”

图片由AI生成

“说实话,我从未像现在这样对我们的研发和产品方向感到这么乐观。”

在12月12日,OpenAI的CEO萨姆·奥尔特曼(Sam Altman)在推出GPT-5.2的同时,发表了一篇庆祝公司十周年的文章。

他努力传递出自己依旧充满信心的态度。毕竟,尽管GPT大模型和ChatGPT聊天机器人在AI领域依然占据领导地位,但我想此时的奥尔特曼内心的竞争压力绝对是空前的。

今年以来,DeepSeek、Grok、Claude等对手的快速追赶,尤其是谷歌上个月推出的Gemini 3,都让AI大模型的竞争变得更加激烈。

不久前,奥尔特曼在公司内部备忘录中提醒员工,得接受大模型不一定都是自家开发的这个现实,接着,他还发出了公司首个“红色警报”,强调“必须立刻行动,集中所有资源抢回领先优势”。

“GPT-5.2荣膺‘打工人之王’,谷歌Gemini系列强势回击!”

截图来自社交平台X

只有更强大的产品才能支撑起这种自信。

在十周年纪念日这天,OpenAI重磅推出了备受期待的GPT-5.2,测试结果再次超越了所有竞争对手。

但谷歌也不甘示弱,几乎在同一时间推出了新产品,让这场大模型之争的竞争变得更加白热化。

GPT-5.2被评为“最强AI打工人”,但“工资”也不便宜

这次GPT-5.2依旧“全力以赴”,一次性发布了Instant、Thinking和Pro三个不同级别的模型。

一个月前Gemini 3发布时,其评测得分几乎是“碾压”GPT-5的表现,引起市场的广泛关注。

而这次,根据OpenAI发布的基准测试结果,GPT-5.2实现了全面反超,其Thinking模型的测试得分均高于Gemini 3 PRO和Anthropic的Claude Opus 4.5。

特别是,GPT-5.2在博士级别的专家推理评估GPQA Diamond中得分高达92.4%,相比于GPT-5.1 Thinking的88.1%和Gemini 3 PRO的91.9%又有了显著提升。在不使用工具的情况下,GPT-5.2在最新的美国数学邀请赛(AIME2025)中获得了满分。

OpenAI特别强调了GPT-5.2在专业工作方面的优势,称其Thinking模型是“当前最适合各种专业用途的模型”。

在用于评估专业技能的GDPval测试中,该模型得到了70.9%的高分,比GPT-5.1 Thinking高出32.1%,领先Gemini 3 PRO则有17.4%。而且在编程等企业工作中,之前表现更佳的Claude Opus 4.5,GPT-5.2也超过了11.3%。

“GPT-5.2荣膺‘打工人之王’,谷歌Gemini系列强势回击!”

图片来自OpenAI

OpenAI展示的案例中,GPT-5.2专注于制作表格、数据整理分析、项目流程图等非常实用的工作场景。

公司还表示,这款新模型在编写代码、制作PPT、图像感知、理解长上下文、使用工具以及处理复杂的多步骤项目方面都表现得相当出色,错误率也比前代产品大幅减少。

模型发布后,GPT-5.2在实际工作应用中的表现得到了很多好评,用户甚至称其为“最强AI打工人”“职场最佳拍档”等。

不过,这个“打工人”的“高工资”可能会成为一个问题。

数据显示,GPT-5.2的输入输出成本比前代增加了40%,输入价格为21美元,输出价格则高达168美元。

这引发了一些担忧,之前OpenAI通过增加算力来发展大模型的做法已受到质疑,无论是DeepSeek还是Gemini,似乎都证明了AI应用可以采用更高性价比的模式。

再加上市场对以OpenAI和英伟达等引领的资本支出狂潮的警惕,以及对泡沫的焦虑,GPT-5.2如果真是靠算力“硬碰硬”来实现反击,显然也是奥尔特曼需要考虑的隐忧。

谷歌给OpenAI送上了一记重击,提前一小时发布Gemini Deep Research

说实话,OpenAI的竞争对手们早已蓄势待发,准备对这次GPT的重大更新进行反击。

就在GPT-5.2发布前约一个小时,谷歌更新了他们的产品,宣布Gemini Deep Research全面升级,并首次向开发者开放。这一举动引起了不少关注,显然谷歌不想让OpenAI独占风头。

根据谷歌的说法,Gemini Deep Research是基于Gemini 3 PRO开发的,经过多步强化学习训练,显著减少了“幻觉”现象,在处理复杂研究任务时表现得更加准确。

在被称为人类终极大考(HLE)的测试中,Gemini Deep Research得分为46.4%,比GPT-5.2 Thinking的45.5%高出不少,仅次于GPT-5 Pro的50%。

“GPT-5.2荣膺‘打工人之王’,谷歌Gemini系列强势回击!”

图片

不过,更让人惊讶的是它的成本。谷歌的产品经理透露,新的智能体在功能上与GPT-5 Pro相当,但成本仅为其十分之一,这种高性价比的优势可不是随便能遇到的。

相比OpenAI,谷歌如今的竞争力在于更高的性价比、独特的训练模式、稳定的现金流和自家的专用芯片,这些都为谷歌的崛起提供了有力的支持。

现在,在大模型的较量中,谷歌的优势依旧明显,这给OpenAI带来了不小的压力。

而且,谷歌还同步开源了基准测试工具DeepSearchQA,涵盖了17个领域的900个复杂任务,以便更科学地评估研究型智能体的能力。

当然,GPT-5.2未必是奥尔特曼保住大模型霸主地位的终极武器。

据说,OpenAI正在加快开发全新的“Garlic”模型,力求以新的方式重塑领先优势。谷歌和Anthropic显然也会继续推出更优秀的产品,而Meta和DeepSeek等竞争者也有不少让人期待的新产品即将面世。

在这场大模型的竞争中,英伟达最近与美银进行了投资者的线上交流会,提到基于Gemini 3的表现优于GPT-5的说法,并不合理,因为大部分模型都是用上一代H系列芯片训练的。用新一代的Blackwell芯片训练的模型要到2026年才会投入使用,届时才能显现优势,更别提尚未投入使用的超级芯片Rubin了。

市场对英伟达的观点褒贬不一,有些人认为模型的强大和芯片的代际关系不大,而另一些则认为性价比才是核心。不过,无论如何,英伟达的言论让我们对明年的大模型竞争充满期待。

到了2025年年底,AI大模型和AI芯片的竞争将更加激烈,预计2026年战况将持续升级。这场战斗不仅是关于大模型性能的较量,更是关于训练和发展路径,以及AI芯片未来的较量。(作者|胡珈萌,编辑|李程程)

来源:今日头条
原文标题:GPT-5.2获封“最强打工人”,谷歌同日以Gemini“性价比”系列应战 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《“GPT-5.2荣膺‘打工人之王’,谷歌Gemini系列强势回击!”》有7条评论

  1. OpenAI这次的GPT-5.2真是让人惊喜,看得出他们在技术上投入了很多心血。尤其是专业工作能力的提升,让我对未来的应用场景充满期待。

    回复
  2. 谷歌的Gemini 3给了OpenAI很大的压力,但GPT-5.2的表现确实出色,尤其是在数学和编程方面的突破,值得关注。

    回复
  3. GPT-5.2的能力提升令人印象深刻,特别是在数据分析和项目管理方面,确实展现了强大的实用性,期待它在未来的应用。

    回复
  4. GPT-5.2在各项测试中的优异表现让人对AI的未来充满期待,尤其是在专业领域的应用上,它的能力提升将极大提高工作效率。

    回复
  5. OpenAI的GPT-5.2在各方面的表现都非常出色,尤其是在专业应用中,它的能力提升让人对未来的工作方式充满期待。期待看到更多实用案例!

    回复
  6. GPT-5.2的推出让人感受到OpenAI在技术上的进步,特别是在编程和数据处理方面的表现,真是让人期待它的广泛应用。

    回复
  7. GPT-5.2在各项专业能力上的提升非常显著,尤其是在数据处理和项目管理方面的应用,真让人对未来的工作方式充满期待。

    回复

发表评论