

说真的,谁能想到OpenClaw的热度会一直持续到现在呢?国内的很多大模型公司也开始加速布局“AI养虾”这一领域。上个月底,来自上海的MiniMax在其Agent平台上推出了MaxClaw模式,利用M2.5大模型,只需10秒就能部署一个全天候的私人助理。
这让大家更加期待MiniMax的新一代大模型发布后,会在以“养虾”为例的Agent场景中带来怎样的新玩法。
就在昨天(3月18日),MiniMax的新模型M2.7终于亮相了,果然没有让人失望——它具备多场景应用和系统级能力,成为了一款全能选手。而且,M2.7还是MiniMax首次深度参与自我迭代的模型!

指令遵循和多智能体协作能力的大幅提升
从M2.5到M2.7,看似只是一小步,但实际上M2.7有哪些硬核亮点呢?
毫无疑问,指令遵循和多智能体协作的能力大幅提升。在应对复杂的技能环境时,M2.7的调用能力极其稳定。官方测试显示,在包含40个复杂技能的场景中,它的遵循率高达97%,而在MM-Claw“龙虾测试”中的正确率也达到62.7%。
此外,M2.7自带多智能体协作功能,不需要外部框架就能组建Agent团队。模型能稳定地锚定身份并自主决策,智能体之间通过配合,能够将长流程任务拆解并执行完毕。
Agent Teams协作模拟演示
继续往下看,代码能力也得到了直观的提升——它不仅能生成代码,还扩展到了代码重构、防漏洞和复杂排障等更高阶的领域。
在办公场景中,M2.7处理复杂的Office文档也相当顺畅,能够支持Excel表格、Word文档和PPT的多轮复杂修改。以某公司的真实案例为例,给它年报和会议资料后,它不仅能自主比对研究报告,还能构建营收预测模型;分析完成后,它会直接生成Excel透视表,轻松写出Word调研报告,并基于模板排版出可以直接汇报的PPT。
业内人士都表示,以前的大模型大多只被当作“最强大脑”,而现在MiniMax发布的则是一个拥有“手脚、工具和记忆”的多面手系统。
大模型开始自我进化了
当模型拥有自我构建工具链、优化执行路径并在反馈中持续重写自身策略的能力时,它的定位就发生了根本变化:不再只是被优化的对象,而是优化过程中的一部分。
研发人员告诉新民晚报记者,“M2.7已经具备自我构建复杂Agent Harness的能力。”Agent Harness其实就是模型与现实电脑环境交互的工具箱和操作台,OpenClaw可以理解为Harness的一种。简单来说,以前的模型通常是用人给的工具,但M2.7现在已经能够自己创造工具了;而且,它还能主动迭代Harness本身,给整个工具箱带来升级。
在MiniMax内部,Agent Harness的价值已经得到验证,仅用1人、4天、零代码,M2系列模型就以“架构师”的身份自主搭建起完整的开发Agent系统,并在此基础上构建了一个覆盖数据、训练、评测与记忆的研究型Agent体系。人类工程师只需设定方向,模型便能完成构建,形成“用AI迭代AI”的自我进化闭环。

新民晚报记者了解到,MiniMax设计并实现了一个简易的脚手架来引导Agent进行自主优化,核心模块包括短时记忆、自反馈和自优化。具体来说,Agent每轮迭代后会生成一个短时记忆文件,并对当前轮次的结果进行自反馈,从而为下一轮提供潜在的优化方向。下一轮则基于所有历史轮次的记忆和自反馈链进行自我优化。
值得一提的是,得益于模型自我演化出来的自迭代能力,M2.7在科研方面的表现显著提高。它在以Kaggle竞赛为基础构建的MLE Bench评测体系中发起挑战,并在MLE Lite的22道高难度竞赛题目中,一举获得了9项金牌。
让模型稳定融入真实工作流
很多人认为,M2.7的发布,对于这家刚完成资本跃升的大模型独角兽来说,或许只是它漫长马拉松中的一个节点。

从此次新发布的重点来看,M2.7正在尝试回答一个问题:模型是否能稳定融入真实的工作流。正如MiniMax创始人、CEO闫俊杰所说,大模型的真正价值不在于制造对立,而在于作为一种日常工具,分担那些繁琐的“脏活累活”。
目前,整个行业都在密切关注硅谷的动向,纷纷加入“吃虾”的热潮,忙着适配OpenClaw以追赶热度。当然,跟进开源脚手架虽然能快速提升体验,依然只是在教模型如何使用人类的工具。
然而,MiniMax已经切入了一个更重要的话题,那就是让模型自己创造工具进行研发,甚至成为自身研发链条的一部分——这种主动进化的能力,或许将成为下一代大模型竞争力的关键。
原标题:《直接让“龙虾”学会自我进化!MiniMax这次的“上新”很不一般》
栏目编辑:马丹
本文作者:新民晚报 郜阳
题图











