编辑:KingHZ
【新智元导读】AI的发展是不是已经遇到瓶颈了呢?这份被称为“最重要的图表”的资料告诉我们:从2019年到2025年,任务的处理时间每几个月就会翻一番,这显示了编码智能体的转变,从短跑选手变成了马拉松的冠军。AGI不再是遥不可及的梦想,而是触手可及的现实!
2025年就快到了,真正的高手其实藏在了“民间”!
这次的冠军不是谷歌,也不是OpenAI,而是Anthropic的编程模型Claude Opus 4.5。

根据METR最近发布的报告,Claude Opus 4.5已经可以持续自主编码,最长可达5小时而不崩溃。
就连OpenAI的顶级编程模型——GPT-5.1-Codex-Max也自愧不如。

如今,全网都在为Claude Opus 4.5的编码能力感到震惊。



说实话,AI编码智能体所能处理的任务时间不仅在快速增长,甚至这个增速还在不断加快!
从2019到2024年:每七个月,任务时长就会翻倍一次
而到了2024到2025年:每四个月,任务时长再翻一倍

第一次看到这张曲线,很多人可能会疑惑。
有些人不理解,有些人则是不愿意相信。
但越发明显的一个事实是:AI编码智能体完成任务的时间,正从“几分钟”迅速跃升到“几小时”,而且这个速度还在不断加快。
很多网友认为,这张图是AI领域的关键图表:

为什么这张图会被认为是“最重要的图表”呢?
因为它直接回答了一个至关重要的问题:
AI是否陷入停滞?AGI是否只是一个美好的幻想?到2025年,AI究竟会有怎样的进展?
普通用户对此的感觉可能不强烈,这很正常。对大多数人来说,AI模型早已可以处理日常的提问了:
比如“推荐一部电影”、“解释一下这个概念”或者“写一段文案”。
但其实,真正的变化发生在另一个领域:编码智能体。
而这恰恰是大部分人(包括记者和政策制定者)不容易理解的一个方面。
虽然这些进展看起来微不足道,但一旦累积起来,其影响是相当深远的。

到2026年4月,第一批AI智能体将能够独立完成一个完整的工作日;
到2026年底,AI将能处理一半的工作量;
到2027年底,AI能够完成两个月的工作任务;
到2028年底,AI将能承接人类几个月的工作量;
而到2030年,AI将能够承担小型企业或组织的大部分管理职责。

AI将迎来爆炸性增长
智能时代已经到来
为了比较人类和AI的能力,今年3月,METR提出了一个新概念:50%的任务完成时间跨度。
简单来说,就是把AI当作新手,给它一项任务,看看当它有50%的把握能完成时,人类通常需要花多长时间。
目前,GPT-5.1-Codex-Max可以处理持续2小时53分钟的软件开发任务(成功率为50%),能力是o1的四倍。
而Claude Opus 4.5的50%时间跨度大约是4小时49分钟,这也是目前为止最长的记录。

虽然50%的任务完成时间跨度看起来很长,但Opus 4.5在80%时间跨度的表现为27分钟,这个数据和以往的模型差不多,甚至低于GPT-5.1-Codex-Max的32分钟。

不过,Opus 4.5在50%和80%时间跨度之间的表现差距显示了它在处理较耗时任务时的独特优势。
甚至有些人觉得,Claude Code已经相当接近通用人工智能了。

当然,最后这个说法可能有点夸张,但它确实反映了某种现实。
2025年将会是AI讨论最混乱的一年,实际进展和公众舆论的差距从未如此明显。
明年可能会有一些变化——当编程智能体的影响力逐渐渗透到社会经济的各个方面时,大家会真正感受到它的强大。希望到那时,我们能做好准备迎接这场变革。

AGI正在逼近
记忆成最后的挑战
智能体处理任务的能力越来越强,这一点并不让人意外。
之前的研究主要指出了四个原因:
- 推理能力增强:能够把复杂的任务分解成更小的部分
- 工具使用更加熟练:会编程、会搜索网络、会执行脚本
- 自我纠错更可靠:出错了可以回退、重新尝试、继续推进
- 收益不会递减:哪怕只是稍微提高一点准确性,能够处理的任务范围就会大幅增加

比如,新一代的模型能够更好地规划子任务,调用外部工具(例如编程、网页搜索),而且在遇到错误时能够自我修正,这样在长时间的任务链中成功率也能保持得不错。
当然,我们在憧憬美好前景的同时,也得认清现阶段的局限性。
不过,当任务的范围从“小时”变成“工作日”时,新的问题就会显现:
- 上下文可能会丢失:越做越容易忘记之前提到的内容
- 错误会逐渐累积:小失误可能导致大麻烦
- 目标可能会模糊:进行中可能会偏离主题
归根结底,这些问题都指向了一个核心:长期记忆。


记忆:通往AGI的最后难题
其实,几乎所有AI的短板,最终都和记忆有关。
想象一下,现在的这些大模型,就像是一个非常聪明、反应极快,但一到下班就“忘记一切”的新员工。
它能写代码、推理,甚至能写文章,但一旦对话结束,它几乎不记得自己刚刚做了什么。
现在很多智能体的“记忆”主要依赖于两种方式:
- 强大的检索工具:需要时去搜索(就像在代码库里用grep一样)
- 总结并压缩:把以前的内容浓缩成几句话,再重新输入
虽然信息检索技术有了不小的进展,但即使是当前最顶尖的RAG(检索增强生成)系统,准确率也大约只有90%。
上下文窗口的扩展确实在改善这个问题:更大的窗口意味着可以同时输入更多的数据,从而帮助模型更高效地在海量记忆中“阅读”。
不过,即便如此,要达到AGI那种“细致入微”的记忆水平,依然需要在底层架构上实现突破。
更重要的是:目前还没有任何系统真正实现了“自我学习”。

没有长期记忆,AI就没法像人类一样“越用越聪明”,也无法从错误中吸取教训,谈不上积累“常识”和“智慧”。
单纯的“记住”是不够的,智能体还得能从经验中主动“学习”。
与智能体不同,人脑擅长将短期的经历转化为长期的记忆,逐渐形成知识的网络和经验的教训。

如果AGI想追赶人类的聪明才智,就得拥有这样的记忆系统。
业内普遍认为,记忆就像通用智能的最后一块拼图,缺了它可不行。
换句话说,虽然AI的计算能力和智能水平已经接近AGI的需求,但它缺乏的就是那种像人类一样能够持久且丰富的记忆。
谁能率先解决“记忆难题”,谁就会在AGI的竞争中占据先机。

明年的突破
长期被动记忆
现在的智能体在“搜索”方面的能力非常强,比如你用Cursor时,会发现它几乎能无缝地从整个代码库里找到所需的信息。
但它们依然依赖于“主动记忆”的方式:智能体必须自己去寻找记忆,而不是这些记忆自然而然地存在于它的思维里。
这显然还不够。
一个能运行文本搜索工具grep的智能体,并不等于有良好记忆的智能体。就像一个计算器并不能被视作数学家。

给智能体一个“搜索记忆工具”并不能解决根本问题。
那么,究竟一个强大的AI记忆系统应该具备哪些特性呢?
未来的智能记忆:我们期待的AI变革
真正的记忆应该像人一样,无需刻意去翻找,直接就能记得。
目前的记忆方式还是有些粗糙,一旦面对稍微复杂的任务,就会完全失效,智能体又得回到依靠“搜索”的老路上。
纽约通用智能公司的创始人Andrew Pignanelli预计,在接下来的12个月里,AI行业在「被动记忆系统」方面会有显著进展。

未来的一年里,记忆系统(特别是智能体的学习能力)将成为AI领域的热门话题,被认为是通往通用人工智能(AGI)的关键一步。
在OpenAI推出了ChatGPT的记忆功能后,Claude也紧随其后,其他知名模型公司也开始着手完善自己的记忆系统。
- 长期记忆工具的使用体验将会大幅改善,尤其是随着上下文窗口的不断扩展;
- 所谓的「睡眠时间智能体」,会在你毫不知情的情况下,帮你阅读邮件、文件和表格,建立背景知识和个性化记忆;
- 「实时智能体」在信息检索方面会越来越精准,你的偏好、语言风格和行为习惯都将迅速被融入。
不过短期内,自动注入上下文的方式可能还不够自然,为了更准确的记忆检索,大家可能得忍受「响应速度慢」的现状。
然而,随着AI越来越“懂你”,你对它的依赖感也会逐渐增强。
在用户体验方面,大家可能会发现「对话开始时有点卡顿」,但不知道背后其实是一个庞大的记忆系统在默默运行。
到今年底,「上下文腐烂」的问题(context rot)将会被解决,方法包括:
- 引入「遗忘机制」;
- 专为长期对话设计的上下文清理系统;
- 更先进的「上下文检索」技术(能够从海量信息中精准提取关键内容)。
未来,用户将不再通过文件树来查找信息,而是直接由AI智能体来帮助你检索和访问所需数据。像Replit和Lovable这样的代码生成平台已经在这方面走在了前头。
预计明年春天(2026年),将会出现由「新一代多模态大模型」与「超越注意力机制的记忆系统」结合带来的突破。
在接下来的12个月里,「记忆+学习」领域或将迎来重大的突破。
OpenAI等行业领军团队正全力以赴攻克持续学习和自我记忆技术;一旦他们取得突破,并把这些技术运用到顶尖模型上,我们或许会惊叹:AGI真的来了。

AGI的曙光正在显现
从现在的发展趋势来看,AGI已经不再是那种遥不可及的科幻幻想,而是真实可能就在眼前。
这种预测并不是凭空而来的。
回顾过去一年,我们其实常常低估了AI技术的飞速发展。
虽然GPT-5发布时的评价褒贬不一,但它在处理长任务方面的表现,已经比之前的版本强了不少;而Claude 4.5的出色表现,更是证明了技术进步并不是线性的:当关键技术得到突破时,进展会突然加速。
现在,你可以发现,随着机器智能逐渐成为生产的重要元素,许多新型组织也在不断涌现。
这是第一次,这个新要素为我们提供了改进流程的新思路。借助AI,甚至小型团队的工作成果,已经能超越过去需要数十人或上百人才能完成的任务,尤其是在一些软件领域,生产力的提升让人惊讶。
这种爆发式的效率,真的是让人倍感兴奋。
这在某种程度上就像是「阿特拉斯卸下重担」的时刻,预示着智能生产力的真正起飞。
与2023年那种充满诗意的「AI觉醒故事」相比,现如今的一切看起来更实事求是,但却更加震撼和真实。
如果记忆问题能够得到解决,AI的能力可能会再次迎来爆发。

届时,AI将不再只是个不停重复劳动的「工具」,而会变成一个越用越聪明,能够和你共同成长的「数字同事」。
它会记住你的喜好。
它能记住你曾经踩过的那些坑。
它能够从项目中提炼出宝贵的经验。
然后在下一次的合作中,主动帮你提升效率。
这正是许多人对AGI在我们社会中所扮演角色的美好愿景。
