揭开AI智能体的神秘面纱:为何我们难以理解它们?

揭开AI智能体的神秘面纱:为何我们难以理解它们?揭开AI智能体的神秘面纱:为何我们难以理解它们?揭开AI智能体的神秘面纱:为何我们难以理解它们?

AI智能体的能力是由大模型的能力决定的,暂时不成熟的原因是目前大模型的准确率和逻辑推理能力,尤其是对复杂任务的理解和规划能力还不够高

文|《财经》研究员 吴俊宇 周源 黄思韵

编辑 | 谢丽容

编者按

几个月前,国际知名的IT咨询机构Gartner对AI智能体(Agentic AI,代理式AI)进行了预测。预计到2028年,也就是三年后,全球有33%的企业软件会使用这种代理,而在2024年,这个比例还不足1%;到2028年,将有15%的日常工作会由这些智能代理来完成,而2024年几乎为零。

基于人工智能大模型的新一代应用即将大规模替代人类在众多领域的思考和创造,未来将会有成千上万的AI智能体不断涌现,这一创新的浪潮正在加速到来,随之而来的颠覆性变化和挑战是我们无法回避的,唯一的选择就是积极拥抱。

最近在《财经》进行的专业调研中,我们发现了一个显著的变化——AI确实在迅速替代程序员的工作。参与调研的一些大型科技公司和商业机构的代表表示,他们的项目中,有20%甚至高达80%的代码是由专业的AI工具编写的。这一变化在过去的一年里发展得非常迅速。

程序员是与AI关系最密切的职业,AI改变一切的浪潮,首先影响到了他们。可以预见,未来会有越来越多的职业被AI所影响,AI智能体将深度介入人们的工作生活,彻底改变社会的运行方式。

从AI的角度来看,我们的社会正在迅速进入一个智能体的新时代。你知道吗?今年在硅谷风头正劲的“个人独角兽”概念,就是在这样的背景下诞生的。投资者们普遍认为,随着AI技术的飞速发展,AI智能体将逐渐取代创业公司中人的角色。想象一下,未来一个人就能借助多个AI智能体的协作,创建出一家独角兽公司。

对个人来说,智能体时代真是太方便了。你可以在晚上睡觉前,安排Agent去处理写文档、查资料、制作PPT、订机票等琐事。早上一觉醒来,就能查看到完成的成果。

那么接下来会出现什么样的变化呢?这既让人兴奋,也让人担忧。

通常来说,一项革命性技术(比如AI)会经历几个阶段:从技术的起步,到逐渐成熟,再到应用和产品的出现与普及,最后颠覆我们的工作方式、生活习惯以及经济和社会结构。

根据过去一年的发展,AI技术现在正快速穿梭在第二和第三阶段之间,而AI智能体正是这个阶段的核心关键词。

在此,我们有必要进一步聊聊AI智能体的能力。简单说,它是一种可以感知环境,依据自身知识和算法自主决策,并执行特定任务的智能实体。换句话说,AI智能体就像一个拥有“感知-思考-行动”能力的数字生命体,能够在复杂多变的环境中独立运作,完成各种任务。

也就是说,AI智能体可以看作是“类人助理”或“类人员工”。当然,根据《财经》的研究,无论在美国还是中国,这两个全球AI技术的领军国家,AI智能体目前都还处于蓬勃发展的阶段。

不过,在投资和技术的双重推动下,AI智能体正快速进化。

7月10日,特斯拉的创始人Elon Musk发布了Grok 4。这款AI系统与市面上以往的大语言模型大相径庭,它强调多智能体之间的协作、多模态交互和实时联网能力。马斯克在介绍中甚至称这款模型“几乎比所有学科的研究生都更聪明。”

紧接着的7月16日,软银创始人孙正义与OpenAI的CEO萨姆·奥尔特曼在SoftBank World2025活动上交流,孙正义提到今年将在软银内部部署10亿个AI智能体,并设计相应的操作系统。

技术更新速度如此之快,可以想象人类即将迎来一个全新的时代——智能体时代。这个时代的一个积极趋势是,AI并不是要取代人类,而是赋予每个人超能力。

在智能体时代,生存法则其实很简单。对企业来说,未来的竞争力将由“智能体渗透率×数据资产厚度”决定。目前,企业在最新AI技术的布局上,需要从“单点应用”迅速转变为“全链智能重构”。

对个人而言,当AI负责提升“运行效率”时,我们更需关注“定义意义”,适应加速进化的生存节奏,提高智能体的驾驭能力,避免被AI取代,这都是非常重要的议题。

国家和政策制定者需要超越传统的监管框架,建立一个“技术-制度-文明”三层治理体系,预测智能体的行为边界(例如禁止健康助手建议基因改造),设立伦理防火墙,探索“人机权责”的法律新模式。

最终,这场变革将是人类创造力与机器执行力在智能体框架下的共演提升。

那么,Agent(智能体)到底是什么呢?简单来说,它就是下一代的AI应用。

这与我们现在用的电脑、手机应用有着本质的不同——Agent的直译是“代理人”,它是一套能帮助人类自主运用AI来规划任务并执行的系统。

今年3月,猎豹移动的董事长傅盛在接受《财经》采访时提到,按照自动驾驶L1-L5的标准,目前大部分Agent都处于L1-L2的阶段。想象一下,如果它有朝一日进入L5阶段,我们就可以在睡前安排Agent去写文档、查资料、制作PPT、订机票等,早上醒来直接查看成果。

那么,什么样的应用可以算是Agent呢?目前并没有统一的标准。大模型应用里的聊天助手、多任务AI应用都被称作Agent,但前者的功能常常过于简单,而后者在执行复杂任务时又容易陷入困境。

许多人在使用这些产品时都会感到困惑——难道这些就是Agent吗?

到了2025年,AI(人工智能)落地的过程中,Agent正处于一个让人“看不懂”的尴尬阶段:一方面,它被视作下一代革命性应用,可能会颠覆一切;另一方面,对于Agent的具体样貌、如何颠覆以及它的潜力,绝大多数人却一无所知。

这组矛盾并没有阻止国际IT咨询机构Gartner将Agentic AI(代理式AI,即本文的主角AI智能体)列为“2025年十大战略技术趋势”。

Gartner预测,到2028年,33%的企业软件将包含Agent,而在2024年这个比例不到1%;到2028年,15%的日常工作将由Agent自主完成,而在2024年这个比例几乎为零。

Agent同样也让从业者重新思考软件的定价模式。传统的订阅付费,似乎正向按结果付费转变。一些创业者正在积极拥抱这种新模式,但也有一些从业者担心,这会导致软件公司彻底失去定价的主导权。

尽管产品形态尚不明晰,定价模式也不够清晰,但这并没有阻碍Agent的浪潮涌来。这些困惑,其实是理解这个新事物的最佳切入点。

揭开AI智能体的神秘面纱:为何我们难以理解它们?

封面设计/黎立

揭开AI智能体的神秘面纱:为何我们难以理解它们?

你是不是也觉得Agent有点看不懂?

其实,Agent的成熟度问题可以从两种产品类型来聊聊:单智能体(Single-Agent)和多智能体(Muti-Agent)。

说到Single-Agent,它其实就是我们常见的对话机器人或者AI助手。比如,字节跳动的豆包App里的英语陪聊机器人和写作助手,统统都被称为Agent。用户问问题,模型来回答,这种简单的互动方式,怎么可能被认为是能“自主决策”的Agent呢?

而Muti-Agent呢,最典型的例子就是AI创业公司“蝴蝶效应”在2025年2月推出的Manus。它自称是“全球首款通用Agent”。在他们的宣传中,Manus能独立进行思考、计划和执行复杂的任务。不过,许多用户在注册使用后却发现,它在执行复杂任务时效果并不理想。

因为产品尚未成熟,Manus的网页访问量也在不断下降。根据国际流量分析平台SimilarWeb的数据,2025年3月的访问量曾达到2310万,但到了4月就降到了1784万,5月又降到1616万。

傅盛在今年3月接受《财经》采访时提到,“用Manus来做贪吃蛇游戏,任务总是进行到一半就出错,也无法手动调代码。实际上,很多专业的代码工具能更好地完成这项任务。”他认为,Agent被过度宣传了,而Muti-Agent的应用依然不够成熟。不过,他也承认,Agent是未来发展的趋势,未来的AI时代就像是一款新的App。

杜克大学的电子与计算机工程系教授陈怡然认为,许多创业公司为了吸引市场关注并获得下轮融资,选择推出不成熟的产品是常见的策略。而OpenAI则是融资后再慢慢打磨产品,实现商业化的一个成功例子。

Single-Agent更像是AI助手,而Muti-Agent则显得不够成熟。这一点让很多企业也感到困惑。

IBM大中华区科技事业部的数据与人工智能资深技术专家吴敏达在一次采访中表示,不少企业客户感到困惑,很多Agent其实并不是真正的Agent,更像是AI助手。他提到两者之间的一个核心区别——Agent可以“自主决策”,能够调用API(应用程序接口)或其他工具来规划任务,而AI助手虽然具备AI能力,但无法自主完成工作。

如今大家熟悉的大部分对话应用,距离真正的“自主决策”还有很长的路要走。吴敏达解释说,AI助手的推理过程相对简单、流程固定,消耗的算力也少,速度和准确性都比Agent要高。然而,Agent则会主动调用更多的AI助手或工具,与其他工具合作完成任务,这个过程需要消耗更多的算力,因此要做好Agent的门槛也更高。

他还认为,Agent和AI助手的定义其实不是最重要的。AI助手肯定会继续存在,而且在企业软件中可能比Agent更具实用性。解决企业真正的问题、确保任务的准确率才是关键。企业也不必追求通用型Agent,试图用一个通用Agent来解决所有问题,这样没有实际意义。

Agent的实力,实际上取决于它背后的“大脑”——大模型的能力。目前Muti-Agent应用的不足,根本原因在于大模型的准确率、逻辑推理能力,尤其是对复杂任务的理解和规划能力还不够高。有一种预测认为,这种情况到2025年底会有很大改善。

火山引擎智能算法负责人吴迪在今年5月对《财经》表示,未来12个月,大模型的能力会不断提升,主要有三个提升方向。

第一,多模态(文本+图片+音频+视频)推理模型将成为主流,这正在发生变化。AI将能够综合处理文本、图片、音频和视频等多种信息进行推理,这将极大增强Agent对现实世界复杂信息的理解能力。

第二,视频生成模型将变得成熟,预计在今年底会迎来一波爆发。这意味着Agent不仅能理解世界,还能以更动态、直观的方式生成内容和模拟过程。

第三,多步骤的复杂任务处理能力预计也会在今年底有重大突破。当模型能够稳定、可靠地规划和执行包含数十步甚至上百步的复杂任务时,Agent“烂尾”的问题将从根本上得到解决。

吴迪认为,目前大多数Muti-Agent应用就像是玩具,但基于这三条技术主线的突破,他判断到2025年末,Muti-Agent应用的准确率将显著提高,Agent的应用会迎来一场新的爆发。

揭开AI智能体的神秘面纱:为何我们难以理解它们?

Agent正在改变什么?

尽管Agent还不太成熟,甚至有些“看不懂”,但它已经成为大公司和创业者们争相追逐的一个新兴领域,带来了不少令人瞩目的变化。

比如,GPTDAO这个位于硅谷的生成式AI社区,专注于追踪各类Agent网站的流量变化,并定期发布AIwatch.ai的数据分析报告。他们会统计面向消费者的AI产品的用户规模、网页访问量以及融资情况。最近,他们发布的一份关于AI Agent的统计数据显示,中国和国际市场的AI Agent产品网页访问量都有了明显的增长。

揭开AI智能体的神秘面纱:为何我们难以理解它们?

在中国,字节跳动和百度都是热衷于Agent领域的重要玩家。字节跳动的扣子和百度的文心智能体平台在短短半年内,访问量都超过了200%的增长;与此同时,像N8n和LangChain这样国际知名的AI Agent平台,也在用户访问量大增的同时,获得了新一轮的融资。

傅盛在今年3月接受《财经》采访时提到,硅谷的Agent创业热潮在Manus大火之前就已开始。他表示,现在的硅谷创业者们已经不再单纯关注模型,而是转向了Agent的开发。他认为,Manus只是个开端,未来中国市场还会涌现出更多类似的产品。

目前,虽然面向普通消费者的Agent还不够成熟,但针对企业的Agent在某些专业场景中,确实能显著提升工作效率。

据观察,大多数美国企业都在积极寻找AI来提升效率的机会,开发专用的“企业级Agent”已成趋势,因为像Manus这样的通用Agent并不适合直接用于特定行业。

那么,为什么To B场景的落地速度更快呢?主要原因在于许多大型科技公司的IT基础设施已经相当完善。一方面,很多企业已经建立了良好的数据治理机制,Agent可以获取更多结构化的专业数据;另一方面,MCP(模型上下文协议)使得Agent能够与其他应用程序进行互动。可以把它想象成一个USB接口,让Agent以简单、标准的方式访问数据和其他工具。

AI编程就是一个提升效率的典型例子。在软件工程中,编写、调试、升级和维护代码一直是耗时的工作,而AI编程类的Agent正在大幅提高这个过程的效率。

百度文心快码的高级经理彭云鹏甚至表示,“写代码是Agent当前最好的应用方向”。他提到,可以把研发任务分配给Agent,多个Agent之间协同工作,互相生成代码并解决一些复杂的任务,前提是要先明确项目的规范、研发规则和测试标准等,只有这样,AI生成的代码才能符合规范。

### AI编程的未来:从代码生成到团队协作

在百度的AI开放日上,大家发现了一个惊人的趋势:AI生成的代码在公司内部的使用比例逐年攀升。去年的数据显示,只有0.27%的代码是由AI生成的,而预计到2025年,这个数字将跃升至43%。使用文心快码的工程师们,提交的代码量比起那些没有使用的同行,竟然提高了近70%。

说到字节跳动,技术副总裁洪定坤在最近的发布会上透露,超过80%的工程师现在都在使用他们自家的TRAE代码工具来辅助开发,AI生成的代码比例也在不断增加。同样,传统行业也在迅速跟进,一位大型银行开发中心的高级工程师告诉《财经》,他们的银行现在有20%-30%的代码是AI写的。

一位医疗硬件创业公司的资深算法工程师表示,这些数据一点不夸张,实际上他日常工作中有80%的代码都是AI生成的。他还给《财经》展示了如何用AI工具Cursor调用Claude Sonnet 4模型,快速生成并修改网页游戏。在演示中,Cursor仅用了一分钟就生成了三个文件,最终在网页上成功运行了贪吃蛇游戏。

虽然贪吃蛇游戏看起来简单,但所有的规则和开发过程都是AI自动完成的,整个过程中没有人手动修改代码。对于更复杂的项目,AI工具可以帮助规划任务,把大任务拆成小任务,确保每一步都稳妥进行,这样工程师就能及时发现问题,保证项目质量。

这位算法工程师还提到,只要掌握合适的工作流程,通过对话就能轻松搞定所有代码。贪吃蛇游戏只是冰山一角,AI代码生成工具在各个代码工程领域的应用越来越广泛。

比如,亚马逊AWS中国区的一位工作人员分享了他们团队的经历:他们在两天内就成功将超过1000个应用从Java 8升级到Java 17,每个应用的升级平均只用10分钟,而以往这样的工作通常需要两到三天。

AI的代码生成工具不仅能节省成本,还能让人们摆脱繁琐的工作,专注于更具创造性的任务。它让原本只有少数程序员才能掌握的技能,变得人人可用,只要有想法和创意,谁都能尝试。

举个例子,高伟翔在中央美术学院学习产品设计,五月份的时候,他没有任何编程经验,却利用字节跳动的扣子空间,在一个月内独立开发出了他的毕业设计——“荒诞商品生成器”,这个小程序可以根据用户的情绪生成独特的艺术图片。他说,“如果没有扣子空间,我可能得外包给程序员,但现在我完全能自己做,开发成本更低、可控性更强。”

写代码只是AI应用的一个方面。亚马逊的工作人员表示,未来的团队协作会有专注于特定领域的专家,也会有能处理多种任务的通才。这样的协作模式将使得AI能处理更复杂的任务,比如在一个复杂的业务分析项目中,会有专门负责数据收集、分析和报告撰写的AI Agent,它们通力合作,共同完成任务。

既然AI能够快速批量生成代码,那它会不会取代人类工程师呢?

软件的未来,Agent会如何改变游戏规则?

一位资深算法工程师曾提到,如果开发需求不变,人类工程师的数量自然就不需要增加。但实际上,虽然代码的生成能力在提升,市场对开发的需求也在上升,因此人类工程师的数量还是有可能保持稳定。除非AI真的能够完全取代他们。陈怡然分析道,虽然顶尖计算机科学工程师的需求依旧旺盛,但普通工程师的工作机会已经大幅减少。在如今的美国就业市场,能够仅凭基础编程语言就进大公司的机会愈发稀少,许多高校也开始重新审视计算机科学的人才培养方案。

揭开AI智能体的神秘面纱:为何我们难以理解它们?

软件商业模式将迎来新变革?

Agent被视为下一代应用,它正在重新定义软件的商业模式。

其实呢,很多人对Agent感到困惑,不仅因为它的产品形态还不够清晰,更因为从业者们还得重新思考商业模式和定价模式。这种巨变确实让人感到迷茫。

在今年5月的第三届红杉资本AI峰会上,红杉资本的合伙人帕特·格雷迪向150位全球顶尖的AI创始人提出了一个重要观点:

AI所提供的,不再是单纯的工具,而是能够带来的收益。以前那种SaaS软件的订阅付费模式正在被颠覆,客户不再只是为功能买单,而是为结果付费。

传统的SaaS软件一般是按年或按月收费,企业为了使用CRM(客户关系管理)和ERP(企业资源规划)等系统,需要支付一笔包含众多功能的软件套餐费用。这样的订阅付费模式虽然简单明了,但企业却常常发现其中70%的功能其实用得并不多,却还是要支付全额费用。而现在一些Agent开始探索按实际使用量付费的模式,这种传统的订阅付费方式显得有些臃肿和低效。

Agent的轻量化特征让它可以在钉钉、飞书或浏览器等平台上运行,类似于微信和支付宝的小程序。这种“轻”的特性大大降低了软件使用的门槛。

Agent将繁杂的套装软件拆解成一个个独立的功能,按token(模型中的文本单位)或调用次数收费,甚至更直接地“按最终效果付费”,这样的商业模式正在逐步形成。

软件的价值评估标准已经从功能的数量转变为解决了多少问题和带来了多少实际效益。因此,越来越多的SaaS企业开始尝试“订阅+用量”的混合定价模式。

销售易是腾讯旗下的CRM公司,其创始人兼CEO史彦泽在今年3月接受《财经》采访时表示,销售易的Agent产品定价模式是,在传统的订阅基础上,增加了专属的“数字员工”。企业可以选择购买“销售助理Agent”,而管理者则可以购买“NeoAgent平台”来创建个性化的Agent。

具体的收费方式是按“座席人数”来购买每个Agent的使用许可,同时设定算力消耗上限,以此控制token成本,避免因个别用户的超量使用而导致亏损。这种模式兼顾了传统订阅模式的优势,同时有效管理了Agent算力消耗带来的额外费用。

“Agent与CRM结合,可能会彻底改变现有的CRM产品。”某CRM公司的开发人员陈涛对《财经》表示,他们已经成功利用Agent改造了自家的产品,并开始盈利。他认为,以前CRM公司更注重功能的多样性,功能越多,定价越高。然而,接入Agent后,定价将更倾向于结果付费,而不是功能的复杂程度。“未来的定价模式可能会变成,维护多少客户关系,就收费多少。”

一些没有历史负担的创业者则采取了更为大胆的策略。

图灵集市是一家专注跨境电商的AI创业公司。创始人田逸豪在《财经》上提到,他们开发了一个“AI网红营销Agent”,直接采用“按结果付费”的新模式。田逸豪发现Agent最大的吸引力在于效果的交付。

过去,中小跨境电商在寻找海外网红带货时,极度依赖人力。所使用的SaaS软件费用高昂,且无法智能跟踪网红。往往需要多人协作,一个星期最多只能联系30位网红。

田逸豪提到,他们现在的网红营销Agent可以自动匹配合适的网红,并用算法生成个性化话术进行邮件联系及合作。这个过程几乎全由AI主导,只有在报价和寄送样品等关键环节需要人工审核,整个流程一个人就能搞定。

“效果交付”成为他们的核心卖点。中小卖家非常看重转化率且现金流紧张,图灵集市正在尝试两种收费策略:一是从交易的商品交易总额中抽取1%-3%;二是根据实际效果付费,比如每联系到一个网红收取一定费用。“以前没有AI时,大家不敢这么说。现在有了AI,我把结果卖给你,自然就能收费。”田逸豪如是说。

然而,针对“按结果付费”的模式,也有一些谨慎的声音。

2024年11月,一位软件行业的资深投资人曾在小范围讨论中表达了他的担忧——按效果付费可能会让软件公司完全失去定价的主动权。

因为按效果,尤其是按token消耗付费,实际上是按成本定价,也就是“算好算力成本后,加上毛利再进行定价”。在他看来,这种做法相当危险,因为模型和算力的成本非常透明,且一直在快速降低。一旦客户认同这种成本导向的逻辑,他们就会时刻关注大模型厂商的降价动态,软件公司在这个过程中可能沦为模型厂商的“管道”,只赚取微薄的利润。

Agent之所以让人难以理解,是因为所有从业者都正站在一场重大变革的边缘。产品形态模糊、定价模式不明确,若用旧有的经验来思考这些新事物的未来,势必会感到困惑与不适。

### 当软件公司面临转型的挑战时,我们该如何应对?

在如今这个快速变化的时代,软件公司可能会感觉自己变成了模型制造商的“工具”,最终只赚取一些微薄的利润。这种情况有点让人摸不着头脑,实际上,大家都站在一场巨变的边缘。产品的形态越来越模糊,定价的方式也不再明确。如果我们继续用老旧的思维来理解这些新兴事物的未来,难免会感到困惑和不适。其实,面对这样的变化,我们不妨考虑使用一些像wordpress采集插件这样的工具,帮助我们更好地适应和迎接这波浪潮。
抱歉,我无法处理这个请求。

来源:今日头条
原文标题:AI智能体,为什么看不懂?|《财经》封面 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论