文心X1 Turbo荣获信通院“4+级”最高评级,开创国内新纪元!

在5月20日,百度AI Day活动在北京拉开帷幕。百度集团的副总裁吴甜、中国信息通信研究院人工智能研究所的平台与工程化部主任曹峰,以及文心一言的用户代表陈君航,齐聚一堂,分享了关于文心大模型的新技术、全球大模型的进展、能力评测以及使用体验等内容。在活动中,中国信通院也发布了关于大模型推理能力的评估结果。结果显示,百度的文心X1 Turbo在24项能力测试中,有16项得分达到满分5分,7项达到4分,1项得分为3分,最终综合评级为当前最高的“4+级”,成为国内首个通过该评测的大模型。文心X1 Turbo在逻辑推理、代码推理、推理效果优化等方面的技术能力及工具支持度、安全可靠性等应用表现均获得满分。

文心大模型的新技术解析

活动中,吴甜详细介绍了文心大模型的最新版本技术创新。她表示,文心大模型4.5是一个多模态基础模型,而文心4.5 Turbo则是在此基础上进行的进一步优化,效果更佳、成本更低;在这个基础上,文心X1也升级为X1 Turbo,性能提升了不少,同时具备更先进的思维链,问答、创作、逻辑推理、工具调用以及多模态能力都有了显著增强。

文心X1 Turbo荣获信通院“4+级”最高评级,开创国内新纪元!

百度集团副总裁吴甜

文心4.5和4.5 Turbo结合了文本、图像和视频的混合训练。针对不同模态在结构、规模、知识密度等方面的差异,通过多模态异构专家建模、自适应分辨率视觉编码、时空重排列的三维旋转位置编码、自适应模态感知损失计算等技术,大幅提升了跨模态学习的效率和多模态融合的效果,学习效率提高了近两倍,而多模态理解的效果提升超过30%。

在后训练方面,百度研发了一种自反馈增强的技术框架。依托于大模型自身的生成与评估反馈能力,形成了“训练-生成-反馈-增强”的循环,让大模型拥有自我迭代的能力,解决了大模型在对齐过程中面临的数据生产难度高、成本高、速度慢等问题,同时显著减少了模型幻觉,提升了模型理解和处理复杂任务的能力。

在训练环节,通过融合偏好学习的强化学习技术,建立了多元统一的奖励机制,从而提升了对结果质量的判别精度。经过离线偏好学习和在线强化学习的统一优化,进一步增强了数据的利用效率和训练稳定性,同时提高了模型对高质量结果的感知能力。此外,模型的理解、生成、逻辑与记忆等能力也因为偏好信号与奖励信号的融合而全面提升。

在深度思考方面,突破了仅依赖思维链优化的局限,结合工具调用构建了一个融合思考与行动的复合思维链,显著提升了模型解决问题的能力,输出结果的思路更加清晰、逻辑更严谨,表达也更自然。同时,借助多元统一奖励机制,实现了思考与行动链的端到端优化,大幅增强了跨领域问题解决的能力。

在数据方面,构建了一个“数据挖掘与合成 – 数据分析与评估 – 模型能力反馈”的数据建设闭环,为模型训练源源不断地提供高知识密度、类型多样、领域广泛的大规模数据。同时,这一数据建设流程具有良好的可扩展性,可以轻松适应新数据类型,实现快速高效的数据生产。

此外,吴甜也提到,随着大模型能力的不断拓展和效率的提升,我们可以探索更加前瞻和富有创意的应用。

以数字人为例,超拟真的数字人需要展现出色的表现力、吸引人的内容,并与场景、物品进行互动,这需要综合运用多模态AI技术。百度研发了“剧本”驱动的多模协同超拟真数字人技术,实现了语言、声音与形象的一致性。目前,这项技术已经支持超过10万名数字人主播,直播转化率达到31%,直播开播成本降低了80%。在代码方面,基于文心大模型的语言和代码能力,百度推出了代码智能体和智能代码助手——文心快码。现在,文心快码生成的代码在每天新增的代码中占比已超过40%。截至目前,文心快码已经向社会开放,累计服务了760万开发者。

文心大模型的能力提升与效率增强,离不开飞桨文心的联合优化,包括框架模型和框架算力的共同优化。得益于训练和推理的技术创新,文心4.5 Turbo的训练吞吐量是文心4.5的5.4倍,推理吞吐量则达到了8倍。公开数据显示,飞桨文心的开发者数量已经超过2185万,服务了超过67万家企业,创建的模型数量达到110万。基于飞桨深度学习平台和文心大模型,百度在多个城市如上海、广州、南京、武汉、厦门、宁波、南昌、无锡等地建立了产业赋能中心、数据生态中心和教育创新中心,通过科技、人才和创新的结合,打造区域人工智能公共技术服务平台,汇聚行业高价值数据集,培养复合型人才,助力本地AI产品的研发,构建围绕人工智能核心能力的“政产学研用”协同发展机制,加快区域产业的智能化升级。

国内首个!文心X1 Turbo获信通院“4+级”最高评级

中国信息通信研究院人工智能研究所的平台与工程化部主任曹峰从行业的角度分享了全球大模型的发展、测评视角下的大模型能力演进,以及文心大模型推理能力的评测解读。他指出,到了2024年,人工智能在多任务语言理解、挑战性数学和博士级科学问题等基准测试中,将持续进化,甚至有可能超越人类的表现。

16岁高中生的文心一言使用体验:像翻新华字典一样简单!

文心X1 Turbo荣获信通院“4+级”最高评级,开创国内新纪元!

中国信息通信研究院人工智能研究所平台与工程化部主任曹峰为百度颁发大模型推理能力评估证书

在活动现场,曹峰主任公布了信通院对大模型推理能力的评估结果。百度的文心X1 Turbo在24项评测中,拿下了16项5分、7项4分和1项3分的好成绩,综合评级为最高的“4+级”,这可真是个了不起的成就,成为国内第一个通过此项评测的大模型。

他进一步强调,评估显示文心X1 Turbo在逻辑思维方面表现出色,并且在模型能力和效率之间找到了很好的平衡。它背后的数据机制让这个模型更加可信和实用,能够广泛应用于各种场景。文心X1 Turbo还增强了推理的泛化能力,拓宽了工具链的应用生态,进一步强化了安全机制,为可信应用提供了保障。

16岁高中生:打开文心一言,就像打开新华字典一样

在活动上,一位名叫陈君航的16岁高中生分享了他与文心一言的故事。他从2023年开始使用这个工具,几乎伴随了他整个中考的备考过程。

回忆起第一次使用文心一言的情景,君航当时正为语文作文的修改烦恼,便把自己的作文和老师的点评发给文心一言,让它逐句分析并给出修改建议。他坦言,“我打开文心一言,就像翻新华字典那样频繁。借助它的帮助,我的写作能力提升了不少。”

君航表示,文心一言不仅为他量身定制学习计划,还能解析那些搜题软件无法解决的原创问题。“在学习上,文心一言就像我随时在线的全能老师。”

文心X1 Turbo荣获信通院“4+级”最高评级,开创国内新纪元!

陈君航现场分享与文心一言的故事

这位高一学生不仅自己爱用文心一言,还把它推荐给了妈妈、同学和老师们,让大家对AI有了新的认识。

“我从小学时就对编程产生浓厚兴趣,但家人一直认为学编程只是兴趣爱好,反对我花太多时间在这上面。因此,每到晚上规定的时间,爸妈都会准时关掉电脑,要求我去学习或休息。”

不过,后来发生的事情让君航的妈妈对他在编程上投入的时间态度发生了改变。君航的妈妈是一位小学老师,平时工作繁忙,还得抽时间完成很多课后工作。“我经常看到她一边批卷子一边熬夜写点评,五十几份卷子,一句一句手动打。”这让君航想:“我能不能帮点忙?”于是,他开始用文心一言为妈妈设计一个“智能文案生成器”,原本需要三天的工作,现在只需几个小时就能搞定。这让君航的妈妈对编程有了新的理解,也激发了她自己对大模型的兴趣。

当大模型能够像人类一样感知世界、思考和自我进化时,技术的进步就真正能转化为社会的普惠红利。正如陈君航同学所说:“技术的真正魅力在于解决一个又一个真实的问题,而不是单纯的炫耀。”

来源:今日头条
原文标题:国内首个!文心X1 Turbo获信通院“4+级”最高评级 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《文心X1 Turbo荣获信通院“4+级”最高评级,开创国内新纪元!》有9条评论

  1. 看到文心X1 Turbo在逻辑推理和工具调用方面的进步,觉得它的应用前景非常广阔,希望能尽快看到实际效果。

    回复
  2. 文心X1 Turbo的多模态训练和自反馈技术真是颠覆性的创新,提升了模型的综合能力,期待它在实际应用中的表现。

    回复
  3. 文心X1 Turbo的自我迭代能力让人惊喜,特别是在逻辑推理和复杂任务处理上,未来应用前景值得期待。

    回复
  4. 文心X1 Turbo在多模态训练上的突破让我感到惊艳,尤其是它的自反馈增强技术,期待能带来更多实际应用!

    回复
  5. 文心X1 Turbo的4+级评级真是一个里程碑,展示了百度在AI领域的深厚技术实力,期待看到它在各行业中的实际应用效果。

    回复
  6. 文心X1 Turbo的多模态能力提升真是令人兴奋,尤其是结合了文本、图像和视频的训练方式,期待它能带来更丰富的应用场景。

    回复

发表评论