百度推出超强深度思考模型,性能直逼GPT-5!

百度推出超强深度思考模型,性能直逼GPT-5!

智东西

作者 | 王涵

编辑 | 漠影

今天早上,在百度Wave Summit深度学习开发者大会上,百度正式推出了他们的新产品——深度思考模型文心大模型X1.1、大模型开发框架飞桨框架V3.2、智能代码助手文心快码3.5S,还有一系列更新的开发组件。

说到文心大模型X1.1,它的事实性能力比之前的文心X1提升了34.8%,指令遵循能力也提高了12.5%,智能体能力上升了9.6%,在多项基准测试中,它的表现超越了DeepSeek-R1-0528

百度推出超强深度思考模型,性能直逼GPT-5!

现在,用户可以通过文心一言官网或者文小言APP来体验文心大模型X1.1。此外,文心大模型X1.1已经在百度智能云的千帆平台上线,企业客户和开发者们都可以自由使用了。

一、超越DeepSeek,直逼GPT-5!百度文心大模型X1.1多项基准测试取得了SOTA成绩

在会议上,百度的首席技术官王海峰正式推出了文心大模型X1.1。根据王海峰的介绍,这个模型是基于文心大模型4.5训练而来的,文心大模型X1.1在事实性方面提升了34.8%,指令遵循能力提升了12.5%,智能体能力也上升了9.6%

在权威的基准评测中,文心大模型X1.1在多个任务上超越了DeepSeek-R1-0528,取得了第一名的好成绩。同时,它与国际顶尖的GPT-5和Gemini 2.5 Pro相比,表现几乎不相上下。

百度推出超强深度思考模型,性能直逼GPT-5!

文心大模型X1.1采用了迭代式混合强化学习训练框架,这种方式不仅提升了通用任务和智能体任务的效果,还通过自蒸馏数据的迭代生产和训练,让模型的整体表现不断进步。

在客服场景中,文心大模型X1.1能够识别用户的情绪和需求,并通过分析和调用多种后台工具,自动完成客户投诉的处理流程。

在此基础上,百度还开发了剧本驱动多模协同的数字人技术,利用大语言模型生成剧本,驱动语音语调和数字人的形象,最终形成一个完整的数字人。

数字人直播超越真人,百度技术进步引人注目

最近,百度集团的副总裁吴甜透露了一项引人关注的消息:在今年6月15日,罗永浩的数字人主播在百度电商平台上的直播销售额,竟然超过了他自己亲自直播的表现!

而且,这些数字人主播的问答转化率问答接待率可不是一般的高,甚至能超过真人。而且,它们的待机时间长达70分钟以上,这在长时段的直播中,简直就是个无敌优势。

百度推出超强深度思考模型,性能直逼GPT-5!

二、飞桨文心生态开发者超2千万,百度内部45%新代码由AI生成

文心大模型之所以能扩展能力和提升效率,得益于飞桨文心的共同优化。

在大会上,百度还发布了飞桨核心框架3.2版本,这个版本在大模型训练、硬件适配和生态支持方面都进行了全面升级。

百度推出超强深度思考模型,性能直逼GPT-5!

百度飞桨也同步升级了大模型开发套件ERNIEKit高效部署套件FastDeploy,并推出了AI科学套件,其中包括智能流体力学和材料科学开发套件,以及大规模计算图数据集GraphNet

最新数据显示,飞桨文心的开发者已经超过了2333万,合作服务的企业数量也达到76万

百度推出超强深度思考模型,性能直逼GPT-5!

在AI编程方面,百度还推出了文心快码3.5S,全新版本的代码生成准确率提高了26%,特别是在复杂场景下,更是提升了38%,这让它能应对更复杂的任务。

据说,现在百度内部有45%的新代码都是AI生成的,文心快码累计服务了超过1000万的开发者和上千家公司。

总结:飞桨文心的深度联合优化,降低了开发门槛

飞桨与文心的深度结合,不断推动着文心大模型的能力扩展和效率提升。文心快码3.5S的发布更是降低了AI编程的门槛,为开发者和企业提供了强大而高效的工具。

在实践层面,无论是数字人直播还是文心快码的实际应用,这些都为AI与实体经济的融合提供了具体的参考路径,对电商、编程开发等领域的智能化转型产生了实质性的影响。

抱歉,我无法处理该请求。

来源:今日头条
原文标题:百度最强深度思考模型来了!性能追平GPT-5 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论