“人工智能+”行动来袭,四大巨头如何打破“闭环能力”困局?

“人工智能+”行动来袭,四大巨头如何打破“闭环能力”困局?

最近,国务院发布了《关于深入实施“人工智能+”行动的意见》,这其实是个大新闻,标志着我们国家在人工智能的发展上,终于从单纯的技术突破,走向了全面赋能的新时代。

这项行动就像是继“互联网+”之后,国家推动数字经济的又一重要战略,它把人工智能视为新生产力的重要引擎,目标是通过科技、产业、民生和治理等六个领域的深度融合,打造出一个“人机协同、跨界融合、共创分享”的智能经济新模式。我们的目标是到2027年智能终端的普及率超过70%,到2035年全面进入智能社会。

在这个过程中,中国的人工智能企业可谓是关键力量,它们在推动技术落地、创新链、产业链和人才链的协同方面,发挥了非常重要的作用。

到了2025年上半年,随着我们与国际巨头的技术差距缩小,从两年前的18个月缩短到不足半年,大模型技术迎来了新的发展阶段,生成式AI的应用也越来越普及,突破了更多行业的“红线”。我们的AI巨头们,像字节跳动、阿里巴巴、商汤科技和百度,纷纷以“闭环能力”为武器,打破了同质化竞争的僵局,迅速向规模化落地转型。特别是这几家企业,现在竞争的焦点已经不再是模型性能,而是场景渗透和生态协同的效率,闭环能力也成了衡量AI价值的重要标准。

技术突破和路径分化:从参数竞争到生态构建

在国内市场上,字节跳动的全场景覆盖、阿里的开源生态、商汤的多模态深度整合以及百度的AI原生应用扩展,让这几家大模型巨头渐渐突围而出。

字节跳动:全场景覆盖的“开源+可控推理”

最近推出的Seed-OSS-36B大语言模型,凭借512K的上下文窗口,成功打破了长文本处理的瓶颈,支持一次输入90万汉字。它还引入了“思考预算”机制,用户可以通过设置token数量来控制模型的思考深度。比如在面对复杂的数学问题或代码生成时,可以给它更多的时间去深思熟虑。该模型依托火山引擎的算力,形成了“开源模型+开发工具链+内容生态”的闭环,目前已经赋能了豆包等旗舰应用。

阿里巴巴:商业闭环与多模态生成的垂直整合

阿里巴巴的通义千问大模型专注于商业场景闭环,其升级版“通义万相Wan2.2-S2V”正式开源,能够基于人物图片和声音生成高质量的动态视频,展现人物说话、唱歌和表演的效果。同时,他们推出了AI编程工具Qoder,支持代码库的语义搜索与架构分析,允许自然语言任务的委派和一键“维基化”代码库。阿里正通过“开源模型+行业工具”的组合,提升AI模型的场景渗透率。

商汤科技:多模态与具身智能的垂直深耕

商汤科技的日日新V6.5多模态大模型,已成功突破了“图文交错思维链”技术,其推理性能和Gemini 2.5 Pro、Claude-4 Sonnet相当,同时更新了模型架构,性价比提升了3倍。它旨在迅速渗透“生产力工具”和“互动工具”两大场景。商汤的小浣熊办公智能体,推出了金融、教育和政务三个版本,用户数也突破了300万。在互动工具领域,实现了文本与音视频的融合。此外,商汤还推出了“悟能具身智能平台”,依托感知、导航和交互能力,构建AI与物理世界高效互动的通路,促进具身智能的发展。

百度:AI原生应用与行业赋能双引擎

百度开源了文心大模型4.5系列,并完全开放了预训练权重和推理代码。同时,文心X1行业大模型面向金融、医疗和制造等领域,通过行业知识增强技术,使得专业术语的理解准确率提高到92.7%。

此外,多模态大模型技术正成为通用人工智能(AGI)发展的重要战场。商汤科技的联合创始人兼首席科学家林达华认为,智能的本质在于与外界(包括世界或他人)自主交互的能力。这是一个综合性的能力,涵盖感知、推理、决策和学习,仅仅依靠语言模型是无法实现真正的AGI,多模态的信息感知与处理能力是实现AGI的核心要求,也是从语言模型向AGI迈进的必经之路。这也是商汤选择多模态作为核心技术的原因所在。

阿里巴巴的副总裁许主洪也指出,多模态大模型是实现通用人工智能(AGI)的必由之路,它使得AI能够像人类一样,通过整合文本、图像、音频和视频等多种信息,更全面地理解世界,从而带来自然的交互体验和丰富的应用场景。

算力生态比拼

在算力基础设施的竞争中,胜负的关键正在从单纯的规模扩张,转向了性价比和协同创新。四大巨头通过架构的优化与升级,实现了算力效能的飞跃:

企业

算力生态的竞争与未来展望

在科技迅猛发展的今天,各类信息如文本、图像、音频和视频交织在一起,帮助我们更全面地认识这个世界。这种多元的信息交互体验,带来了不少实际应用场景。在算力的竞争中,胜负的关键已经从单纯的规模扩张,逐渐转向性价比和协同创新的较量。四大科技巨头通过不断优化和升级自己的架构,取得了显著的算力效能提升。

算力基建策略

性能突破

成本优化

字节跳动通过火山引擎与动态推理框架的结合,实现了512K上下文窗口的实时处理,同时利用思考预算机制,有效降低了复杂任务的算力消耗。阿里巴巴则依托含光800芯片和ECS超算集群,支持百万级上下文窗口,并且通义模型的推理效率提升了40%。商汤科技则借助大装置、异构集群及SenseCore 2.0,实现了2.5万P的总算力和20%的算力效能比提升,多模态推理的成本也大幅降低,达到了与大规模语言模型相当的水平。而百度通过飞桨平台和昆仑芯片,使得自动驾驶模型的训练效率提升了50%,并通过开源工具降低了部署成本。

商汤的大装置SenseCore 2.0进行了升级,展现出强大的训练和推理优化能力,结合自研的训练框架和双推理引擎(vLLM + LightLLM),线上推理性能提升了15%。同时,字节跳动的动态推理框架,特别是思考预算机制,开创了算力灵活分配的新模式,让其在多项测试中取得了优异成绩。

根据IDC发布的《中国大模型平台市场份额,2024年》报告,百度智能云、阿里云和商汤科技分别占据了行业前三的位置,牢牢把握住了国内市场的第一梯队。IDC指出,过去一年内,大模型平台的竞争焦点已经开始转向智能体开发平台,厂商之间的较量主要集中在工具链的完善程度、Token的调用及争取头部客户等方面。而沙利文与头豹研究院联合发布的《2025年中国AI基础设施市场报告》显示,阿里云、腾讯云和商汤科技位于“领导者象限”的前列,反映了中国AI基础设施的第一梯队格局。

面向未来的场景和落地

技术的优势能否转化为实际价值,关键在于它在特定场景中的应用深度和商业化效率。四大科技巨头的落地策略各具特色。

字节跳动:内容生态的全链路重构

字节跳动的豆包大模型已经帮助抖音实现了月活跃用户破亿,旗下的豆包(通用助手)、Gauth(教育应用)、Coze(开发平台)等五款应用也成功跻身全球Top100。公司通过“爆款复制、流量垄断、赛马研发”三大战略,建立了强大的内容生成生态。

阿里巴巴:开源系列与行业赋能

阿里巴巴已经开源了超过300个通义系列模型,全球下载量超过4亿次。基于通义千问的二次开发,衍生模型的数量超过14万个,已有超过30万家企业接入通义大模型API。通过接入这些模型,商家的工具升级和智能客服的效率提升了50%。

商汤科技:教育和金融行业的智能化变革

商汤在2025年上半年的收入竟然实现了36%的增长!而他们的“小浣熊”系列版本,用户数量已经突破了300万大关。教育版覆盖了500多所学校,适应了超过10种不同的教学场景,帮助了25万多名教师和学生,学习效率提升了15%到30%,课堂的参与度更是提高了2.1倍。此外,商汤与紫光汉图合作推出的作业批改机,准确率超过了99%,十分钟内就能完成全班的作业批改。金融版的推出也让客户的工作效率提升了300%。而且,多模态实时互动的时长增加了510%。目前,商汤的视觉AI服务已经覆盖了国内外660多家客户。

百度:自动驾驶与城市智能化的前沿探索

百度的文心大模型通过开源生态策略,构建了强大的竞争壁垒,每天的调用量高达16.5亿次,深度整合了医疗和教育等行业的解决方案。在自动驾驶方面,Apollo车路协同系统已经覆盖了全国30个城市,L4级的测试里程突破了8000万公里,技术落地的速度在行业中处于领先地位。

这些行业巨头的实践让我们看到了AGI的核心逻辑:技术优势必须转化为生态动能,单纯的参数竞争终究会被场景深耕所取代。当大模型的竞争进入深水区,技术差距逐渐缩小,场景定义能力和开源生态的整合能力将成为未来AI的胜负手。

来源:今日头条
原文标题:“人工智能+”行动发布,四巨头“闭环能力”破局 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《“人工智能+”行动来袭,四大巨头如何打破“闭环能力”困局?》有8条评论

  1. 商汤科技的多模态模型表现不俗,期待能在更多行业中看到它的应用。是否能引领新一波智能工具潮流?

    回复
  2. 这次人工智能的行动计划真是个大手笔,未来的发展值得期待,不过潜在的监管问题也要引起注意。

    回复
  3. 各大企业在生态构建上真是下了功夫,尤其是阿里的商业闭环,有点让人担心是否会导致市场垄断。

    回复
  4. 字节跳动的Seed-OSS-36B大语言模型确实很强大,特别是它的上下文窗口设计,处理长文本时的表现让人刮目相看。

    回复

发表评论