在9月9日的北京,深度学习技术及应用国家工程研究中心主办的WAVE SUMMIT深度学习开发者大会2025如期举行。这次活动是由百度的飞桨和文心大模型联合承办的,会上,百度发布了文心大模型X1.1,并介绍了与文心和飞桨相关的一系列新技术、新产品和生态成果。
文心X1.1深度思考模型正式上线,多个测试结果达到了顶尖水平
在大会上,百度的首席技术官王海峰正式推出了文心大模型X1.1深度思考模型,强调了该模型在事实性、遵循指令和智能体能力等方面的显著进步。现在,大家可以在文心一言官网或文小言APP上体验这个新模型,此外,文心大模型X1.1也已经在百度智能云的千帆平台上全面开放给企业客户和开发者使用。
百度首席技术官、深度学习技术及应用国家工程研究中心主任 王海峰
王海峰在现场提到,文心大模型X1是基于文心大模型4.5进行训练的,而升级后的X1.1则采用了一种迭代式混合强化学习训练框架。这种方式不仅能同时提升通用任务和智能体任务的效果,还通过自蒸馏数据的反复生产和训练,持续增强模型的整体性能。与文心大模型X1相比,X1.1的事实性提升了34.8%,指令遵循提高了12.5%,而智能体能力也增加了9.6%。
在多项权威基准评测中,文心大模型X1.1的整体表现超越了DeepSeek R1-0528,并在某些任务中展现了明显的领先优势。与国际顶级模型GPT-5和Gemini 2.5 Pro相比,效果也保持在同一水平。
文心大模型X1.1在多个基准测试中表现卓越
文心大模型的能力扩展和效率提升,离不开飞桨与文心的协同优化。在大会上,百度还发布了飞桨核心框架v3.2,此版本在大模型训练、硬件适配和生态支持等方面进行了全面升级,同时大模型开发套件ERNIEKit和高效部署套件FastDeploy也进行了同步升级。
根据最新的数据,飞桨文心的生态开发者数量已达2333万,服务的企业超过了76万家。
在大会上,百度文心大模型与中国老龄事业发展基金会共同发起了“AI助老公益计划”,希望通过智能体、AI应用和志愿活动等方式,帮助老年人跨越数字鸿沟,享受更美好的生活。目前,“AI助老智能体”已正式上线,老人们只需在百度搜索“AI助老智能体”或打开小度智能健康屏,就能体验到AI带来的暖心服务。
剧本驱动多模协同的数字人技术,线上直播表现超越真人
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜现场展示了文心大模型X1.1的使用体验,并深入解析了基于文心大模型的最佳实践——剧本驱动多模协同的数字人技术,以及文心数据生态的最新进展。
在现场演示中,文心大模型X1.1在处理复杂写作任务时,能够灵活运用模型内置的知识以及网络搜索工具,准确找到用户所需的信息。同时,它也能深思熟虑地理解用户的创意要求,最终输出内容既符合事实又结构清晰、逻辑严谨且文采斐然。
在更复杂的长程任务场景中,文心大模型X1.1面对共享单车平台的不同用户及他们的多样化问题,同时还要考虑到用户的情绪状态,能够遵循业务流程有序地解决问题,并灵活调用工具,确保服务过程的完整和主动性。
大模型能力的提升和效率的增强,带来了更具前瞻性和创意的应用。举个例子,超拟真的数字人直播需要出色的表现力、吸引人的内容,以及数字人与场景、物品之间的互动,百度开发的剧本驱动多模协同数字人技术,成功实现了语言、声音和形象的完美结合。
数字人科技的未来:百度的创新方案
这项技术方案真是太酷了!它的核心包括了五大创新技术,像是剧本驱动的数字人多模协同、结合多模规划与深度思考的剧本生成、实时互动决策、文本自控的语音合成,以及高一致性的超拟真数字人长视频生成。这些技术让数字人主播展现出“高情商、强互动、长续航、更专业”的独特魅力,真的很让人期待。
吴甜提到,在百度慧播星的实际应用中,数字人的在线表现比真人还要出色呢!早前,罗永浩的数字人直播首秀创下了行业的新纪录,某些核心商品的销售量甚至超过了真人直播的成绩,说明数字人直播的潜力真的不容小觑。
百度集团副总裁、深度学习技术及应用国家工程研究中心副主任 吴甜
吴甜还分享了文心数据生态的最新动态。文心导师作为这个生态的重要部分,通过知识传授、质量评估和专业校准,给大模型提供了指导,帮助用户获得更全面的支持。目前,文心导师中,拥有10年以上行业经验的专家占总数的48%,而专业技术和教育工作者占41%,这真是一个强大的团队!
在大会上,全新推出了“文心导师·星耀计划”,这个计划将依托飞桨文心生态资源,与行业里的精英们共同开创AI的新未来,听起来就很让人兴奋,对吧?
此外,中国科技馆和百度在大会上也共同发布了“首个科技馆智能体矩阵”。这个矩阵深度融合了中国科技馆的科普数据资源与百度的文心大模型技术,还联动了全国28家科技馆,比如山东科技馆、新疆科技馆、湖北科技馆等,吸引了340位独立开发者参与,共同推动了跨馆资源的整合与智能协作,真是个了不起的举措!
正值我国首个法定全国科普月的启动,中国科学技术馆和百度也在大会上宣布了“未来之翼科普共创计划”的启动,真是个好时机!
飞桨框架v3.2发布,ERNIE-4.5-21B-A3B-Thinking模型开源
文心大模型的快速发展,得益于百度在芯片、框架、模型和应用方面的全方位布局,尤其是飞桨深度学习框架与文心大模型的联合优化,这种协同效应可真是强大啊。
百度AI技术生态总经理马艳军正式发布了飞桨(PaddlePaddle)框架v3.2,此外还有文心大模型开发套件ERNIEKit、大模型高效部署套件FastDeploy,以及两款AI科学计算套件PaddleCFD和PaddleMaterials,旨在全面降低大模型从训练到部署的门槛。
通过计算优化、并行策略和原生容错能力的三大核心升级,飞桨框架v3.2成功解决了大模型训练的技术瓶颈,显著提高了训练效率,特别是在ERNIE-4.5-300B-A47B模型上实现了预训练MFU达47%的佳绩。
同时,这个版本在类CUDA芯片的适配能力上也增强了,最高可实现92%的算子内核复用率,并且完全兼容Safetensors权重及生态加速库的一键接入,极大降低了部署成本,真是太方便了!
百度AI技术生态总经理 马艳军
在推理部署方面,大模型高效部署套件FastDeploy通过模型压缩、推理和服务的协同优化,大幅提升了端到端的推理性能。依托这个套件,ERNIE-4.5-300B-A47B模型在TPOT 50ms延迟的情况下,竟然实现了输入57K tokens/秒和输出29K tokens/秒的超高吞吐量,真是牛!
百度最新AI工具大揭秘,助力科研与开发!
在科研领域,PaddleCFD和PaddleMaterials这两款AI科学计算开发套件,简直是提升流体力学和材料科学研究效率的利器!它们不仅能缩短研发周期,还能让任务的精确度大大提高。
在大会上,百度发布了最新的思考模型——ERNIE-4.5-21B-A3B-Thinking。这个深度思考模型是在ERNIE-4.5-21B-A3B的基础上打造的,应用于创作内容、逻辑推理、数学计算、代码生成等多个领域,表现都相当出色。
而且,ERNIEKit这个文心大模型开发套件也提供了更为便捷的模型后期训练方案,只需要4张GPU,就能高效调优ERNIE-4.5-300B-A47B模型,这大大降低了开发者将模型应用于实际的门槛。
此外,百度还开源了一个大规模计算图数据集GraphNet,里面有超过2700个模型计算图和标准化的评测体系,填补了AI编译器测试基准的空白,为优化设计和性能提升提供了极大的帮助。
文心快码全新升级,服务超过千万开发者!
大会现场,百度的智能代码助手——文心快码,已经升级到3.5S(Super Synergistic AgentS)版本。这次升级增强了多智能体的自协同能力,开创了“一人即团队”的新开发模式。
百度副总裁 陈洋
百度副总裁陈洋表示,文心快码3.5S版本从三个方面进行了升级,首先,智能体的能力提升了,能够理解业务,分解任务列表,执行得更加精准;
其次,从单一智能体转向多智能体协同,能够动态生成多个智能体,彼此协作解决复杂任务;
最后,团队协作能力更强,基于规则与MCP建立了一个统一的经验库,实现知识的传承。
据现场数据显示,文心快码现在已经服务于超过1000万的开发者。在百度内部,新增代码中已经有45%是由AI生成的,尤其是前10%的Agent用户,AI完成的部分甚至超过了75%!
