GPT-5.2 强势登场，开启办公效率新时代！

最近竞争环境发生了剧烈变化，OpenAI也不得不迅速作出反应。大家可能会好奇，这究竟是怎么回事呢？谷歌刚发布了Gemini 3，OpenAI内部就感受到了压力，甚至紧急启动了“Code Red”警报，所有资源都集中到了ChatGPT的主线开发上。距离他们第一次推出AI产品已经有1106天，OpenAI迅速推出了GPT-5.2，以此来应对激烈的市场竞争，看来他们真的是有点紧张了。

说到GPT-5.2，它的设计特别注重职场应用，目标就是提高用户的经济价值，虽然个性化体验暂时被放一边。这个模型有三个版本：Instant适合简单任务，速度非常快；Thinking则更擅长处理复杂问题，比如编程和分析长篇文档；Pro版本则是高端用户的选择，追求极致精确。企业用户每天都能节省40到60分钟，重度用户每周甚至能节省超过10个小时，真是不可思议！GPT-5.2的Thinking模型表现非常优秀，GDPval测试显示它的表现能达到或超过70.9%的人类专家水平，覆盖了美国GDP前九大行业。编程能力也得到了显著提升，SWE-Bench Pro测试得分55.6%，而SWE-bench Verified测试更是高达80%，在修复代码的效率上也有了很大进步，甚至可以生成海浪模拟器、节日贺卡和打字雨游戏，大家都对它的未来充满期待。

你可能感兴趣：GPT-5.2体验 – 写代码的能力对比

当然，技术的升级也至关重要，GPT-5.2的幻觉率降低了30%，专业知识的准确性也显著提升，错误率降低，处理长文本的推理能力也增强。在MRCRv2基准测试中，它的表现非常突出，经过多项测试，最多支持256k token的上下文，准确率接近100%。视觉理解能力也有了进步，错误率减少了一半，能够更精准地解读数据仪表盘和产品截图等。此外，在空间理解和工具调用方面，Tau2-bench Telecom测试中获得了98.7%的高分。在数学和科学领域，GPT-5.2的准确率突破了90%，在ARC-AGI测试中成为第一个达到这一水平的模型，真的是非常厉害。

至于商业化方面的布局也开始逐步展开，API的价格虽然高于GPT-5.1，但token的使用效率得到了提升，综合考虑后，实际总成本可能会更低。目前，GPT-5.2已经陆续在ChatGPT中上线，优先向付费用户开放，同时API也同步开放。早期的GPT-5.1模型会在三个月后下线，转入“传统模型”选项中。很多人看完这些信息，心中或许都会有些思考。

OpenAI与迪士尼的全新合作：令人期待的未来

最近，OpenAI和迪士尼达成了一项为期三年的授权协议，这意味着用户将能够生成包含迪士尼角色的视频，真是个令人兴奋的消息！迪士尼还向这项合作投资了10亿美元，意在将内容IP与AI技术结合，前景看起来非常光明。此外，他们还计划推出一个“成人模式”，预计在2026年第一季度上线，且会优化年龄识别功能，以保护未成年人。不过，面对这样复杂的环境，谁能说得清楚呢？