智东西
作者 | 王涵
编辑 | 漠影
今天早上,在百度Wave Summit深度学习开发者大会上,百度正式推出了他们的新产品——深度思考模型文心大模型X1.1、大模型开发框架飞桨框架V3.2、智能代码助手文心快码3.5S,还有一系列更新的开发组件。
说到文心大模型X1.1,它的事实性能力比之前的文心X1提升了34.8%,指令遵循能力也提高了12.5%,智能体能力上升了9.6%,在多项基准测试中,它的表现超越了DeepSeek-R1-0528。

现在,用户可以通过文心一言官网或者文小言APP来体验文心大模型X1.1。此外,文心大模型X1.1已经在百度智能云的千帆平台上线,企业客户和开发者们都可以自由使用了。
一、超越DeepSeek,直逼GPT-5!百度文心大模型X1.1多项基准测试取得了SOTA成绩
在会议上,百度的首席技术官王海峰正式推出了文心大模型X1.1。根据王海峰的介绍,这个模型是基于文心大模型4.5训练而来的,文心大模型X1.1在事实性方面提升了34.8%,指令遵循能力提升了12.5%,智能体能力也上升了9.6%。
在权威的基准评测中,文心大模型X1.1在多个任务上超越了DeepSeek-R1-0528,取得了第一名的好成绩。同时,它与国际顶尖的GPT-5和Gemini 2.5 Pro相比,表现几乎不相上下。

文心大模型X1.1采用了迭代式混合强化学习训练框架,这种方式不仅提升了通用任务和智能体任务的效果,还通过自蒸馏数据的迭代生产和训练,让模型的整体表现不断进步。
在客服场景中,文心大模型X1.1能够识别用户的情绪和需求,并通过分析和调用多种后台工具,自动完成客户投诉的处理流程。
在此基础上,百度还开发了剧本驱动多模协同的数字人技术,利用大语言模型生成剧本,驱动语音语调和数字人的形象,最终形成一个完整的数字人。
数字人直播超越真人,百度技术进步引人注目
最近,百度集团的副总裁吴甜透露了一项引人关注的消息:在今年6月15日,罗永浩的数字人主播在百度电商平台上的直播销售额,竟然超过了他自己亲自直播的表现!
而且,这些数字人主播的问答转化率和问答接待率可不是一般的高,甚至能超过真人。而且,它们的待机时间长达70分钟以上,这在长时段的直播中,简直就是个无敌优势。

二、飞桨文心生态开发者超2千万,百度内部45%新代码由AI生成
文心大模型之所以能扩展能力和提升效率,得益于飞桨文心的共同优化。
在大会上,百度还发布了飞桨核心框架3.2版本,这个版本在大模型训练、硬件适配和生态支持方面都进行了全面升级。

百度飞桨也同步升级了大模型开发套件ERNIEKit和高效部署套件FastDeploy,并推出了AI科学套件,其中包括智能流体力学和材料科学开发套件,以及大规模计算图数据集GraphNet。
最新数据显示,飞桨文心的开发者已经超过了2333万,合作服务的企业数量也达到76万。

在AI编程方面,百度还推出了文心快码3.5S,全新版本的代码生成准确率提高了26%,特别是在复杂场景下,更是提升了38%,这让它能应对更复杂的任务。
据说,现在百度内部有45%的新代码都是AI生成的,文心快码累计服务了超过1000万的开发者和上千家公司。
总结:飞桨文心的深度联合优化,降低了开发门槛
飞桨与文心的深度结合,不断推动着文心大模型的能力扩展和效率提升。文心快码3.5S的发布更是降低了AI编程的门槛,为开发者和企业提供了强大而高效的工具。
在实践层面,无论是数字人直播还是文心快码的实际应用,这些都为AI与实体经济的融合提供了具体的参考路径,对电商、编程开发等领域的智能化转型产生了实质性的影响。
抱歉,我无法处理该请求。
