在12月11日的当地时间,OpenAI终于推出了他们的新款模型GPT-5.2。这次发布可是为了回应谷歌Gemini 3的强劲挑战。GPT-5.2特别针对专业工作场景进行了优化,无论是在编程、科学任务还是处理长文档方面,都有了显著提升。OpenAI表示,这个新模型在“专业知识工作”的表现上是最强的,速度更快,信息获取也更加精准,写作与翻译能力也大大增强。

这次的GPT‑5.2分为Instant、Thinking和Pro三个版本,预计很快就会陆续向ChatGPT的付费用户推出。定价方面,GPT‑5.2的输入tokens为每百万1.75美元,而输出tokens则是14美元每百万。
说到GPT-5.2的强项,那就是在专业化任务的优化上。根据OpenAI的统计数据,这个模型在多项基准测试中都创造了新纪录。在针对44个职业知识型任务的GDPval测试中,GPT-5.2成为首个整体表现达到或超过人类专家水平的AI,竟然有70.9%的任务能与行业专家持平或超越,而且完成速度是人类专家的11倍多,成本还不到专家的1%。

在处理长文本和视觉理解方面,OpenAI的MRCRv2基准测试显示,GPT-5.2在25.6万tokens的超长上下文中,整合多文档信息的准确率几乎达到100%。尤其是在区分多个相似信息点时,表现非常出色,非常适合进行深度文档分析和多源信息整合。
在视觉处理领域,GPT-5.2 Thinking被誉为“当前最强视觉模型”,其在图表推理和软件界面理解方面的错误率比前一代降低了约50%。它能精准解读数据仪表盘、技术图纸和可视化报告等专业视觉内容,非常适合金融、工程和客户服务等需要视觉信息的工作场景。

相比于GPT-5.1,这个新模型的“幻觉率”明显降低,尤其在专业知识密集的场景中,可信度大幅上升。即使在推理强度最低的情况下,GPT-5.2的整体表现依然远超GPT-5.1和GPT-4.1。
OpenAI推出GPT-5.2,主要是希望通过专业知识工作的切入点,吸引更多企业客户,提升收入,以支持未来十多年内超过1万亿美元的基础设施投资计划。
回想一下,今年8月,OpenAI推出的GPT-5曾受到不少质疑,不少人因为其图表错误、专业知识不足和功能优化不达预期而表示失望。而11月紧急推出的GPT-5.1虽然有所改进,但仍旧难以扭转局面。此后,谷歌在11月推出的Gemini 3大模型凭借多模态和长文本处理等优势迅速占领市场。
面对谷歌的竞争,OpenAI的CEO山姆·奥特曼表示,“Gemini 3的影响低于我们的预期”,并透露公司目前处于“红色警戒模式”,预计明年1月前会结束,届时将集中资源进行核心能力的优化,准备强势回归市场。

GPT-5.2的性能提升真令人惊喜,尤其是在专业知识应用上,速度和准确性都大幅提高,确实能帮助很多行业。期待它在实际应用中的表现!
OpenAI的GPT-5.2在专业领域的表现让人刮目相看,尤其在处理长文本和视觉理解方面的进步,真是行业的福音。希望能在更多场景中看到它的应用!
GPT-5.2在多个职业知识型任务中表现超越人类专家,这确实是个了不起的成就。期待它在实际工作中能够发挥更大作用,帮助更多企业提升效率。
OpenAI推出的GPT-5.2在专业领域的优化让人感觉非常振奋,尤其在处理复杂任务时的表现,真的有可能改变工作方式。期待能看到它在更多行业中的应用效果。
GPT-5.2的推出让人对未来的工作模式充满期待,尤其是它在长文本处理和视觉理解上的突破,真是太厉害了!
GPT-5.2的发布在专业知识工作领域带来了显著提升,尤其在处理长文档和复杂任务方面的表现非常强劲,这将对各行业产生深远影响。
GPT-5.2的强大表现令人惊叹,尤其是在与行业专家的比较中,超越人类的能力让人对未来的工作充满期待。这个模型无疑将推动各行业的效率提升。