

谁能想到,OpenClaw的热潮竟然一路延续到现在!国内的AI大模型公司们也开始迅速布局“AI养虾”这个领域。上个月,来自上海的MiniMax在它的Agent平台上推出了MaxClaw模式,依靠M2.5大模型,仅需10秒就能部署一个全天候的私人助手,真是高效!
这让人不禁期待,MiniMax的新一代大模型发布后,会为“养虾”这样的Agent场景带来哪些新鲜玩法呢?
就在昨天(3月18日),MiniMax M2.7闪亮登场,果然没有让人失望——它展现了多场景的覆盖能力,成为了一个系统级的“全能型选手”。最让人兴奋的是,M2.7是MiniMax首次深度参与自己模型迭代的成果!

指令遵循和多智能体协作能力的显著提升
从M2.5到M2.7,虽然看似只是小小的一步,但实际上它的亮点可不少!
首先,指令遵循和多智能体协作的能力大幅提升。在面对复杂的技能环境时,M2.7的表现非常稳健。在官方测试中,涉及40个复杂技能的场景下,它的遵循率高达97%,而在MM-Claw的“龙虾测试”中,正确率也达到了62.7%。
更厉害的是,它自带多智能体协作功能,直接就能组建Agent团队,完全不需要外部框架。模型可以稳定地锚定身份,自主进行决策,智能体之间的配合能有效地拆解并完成长流程任务。
Agent Teams协作模拟演示
往更深层次看,代码能力也有了显著提升——从单纯的代码生成,扩展到了代码重构、漏洞防护和复杂故障排查等高阶领域。
在办公场景中,M2.7处理复杂Office文档也游刃有余,能够支持Excel表格、Word文档和PPT的多轮复杂修改。举个例子,给它年报和会议资料,它能自主比对研究报告,构建营收预测模型,分析后直接生成Excel透视表,顺便写出Word调研报告,还能根据模板制作出能直接汇报的PPT,真是太方便了!
业内人士指出,过去大模型更多的是“最强大脑”,而现在MiniMax推出的是一个拥有“手脚、工具和记忆”的多面手系统。
大模型开始自我进化了
当模型能够构建工具链,优化执行路径,并在反馈中持续改进自身策略时,它的定位就发生了根本变化。它不再只是被优化的对象,而是优化过程的一部分。
“M2.7已经具备了自我构建复杂Agent Harness的能力。”研发人员告诉新民晚报记者。所谓Agent Harness,其实就是模型与现实电脑环境交互的工具箱和操作平台,OpenClaw可以视为其中的一种。简单来说,以前模型只能使用人们提供的工具,而现在M2.7能自己造工具,甚至能主动迭代工具箱,实现升级。
在MiniMax内部,Agent Harness的价值也得到了验证。只用一名工程师、四天时间、零代码,M2系列模型就自如地搭建起完整的开发Agent系统,并在此基础上构建了一个涵盖数据、训练、评测与记忆的研究型Agent体系。人类工程师只需设置方向,模型就能完成构建,形成了“用AI迭代AI”的闭环进化。

新民晚报记者了解到,MiniMax设计了一个简易的脚手架来引导Agent自主优化,核心模块包括短期记忆、自反馈和自优化。具体来说,Agent完成每轮迭代后会生成一个短期记忆文件,并对本轮结果进行反馈,从而为下一轮提供优化方向,而下一轮又基于历史记录和反馈链进行自我优化。
值得一提的是,得益于模型演化出来的自我迭代能力,M2.7在科研表现上有了显著提升。它在MLE Bench评测体系中挑战以Kaggle竞赛为基础的22道高难度题目,竟然获得了9枚金牌!
让模型稳稳融入真实工作流
很多人认为,M2.7的发布,对这家刚完成资本跃升的大模型独角兽来说,可能只是其长跑中的一个节点。

从这次发布的重点来看,M2.7在试图回答一个问题:模型是否能稳定融入真实工作流。正如MiniMax创始人、CEO闫俊杰所说,大模型的真正价值不在于制造对立,而在于如何成为一种日常化的工具,去分担那些繁琐的工作。
目前,整个行业都在关注硅谷的动向,跟着潮流一起“吃虾”,忙着适配OpenClaw来追赶热度。当然,跟进开源脚手架能够快速提升体验,但这仍然只是教模型如何使用人类的工具。
而此时,MiniMax已经切入了一个更重要的话题,那就是让模型自己研发工具,甚至成为研发链的一部分——这种主动进化的能力,或许将是下一代大模型竞争力的分水岭。
原标题:《直接让“龙虾”学会自我进化!MiniMax这次的“上新”很不一般》
栏目编辑:马丹
本文作者:新民晚报 郜阳
题图












我有朋友用过MiniMax的产品,反馈非常好,操作简单又实用。
希望MiniMax在稳定性和兼容性方面能再下功夫,毕竟新技术总有不确定性。
我觉得MiniMax的设计风格真的很前卫,时尚感满满。
希望MiniMax在用户反馈上能多一些互动,这样才能更好地改进产品呀。
自我进化?这听起来像科幻电影里的情节,实际效果怎么样呢?
有点担心新技术是否会带来兼容性的问题,值得关注。
自我进化的龙虾?这听起来就像是未来的生物科技,太神奇了!
对于新科技的兼容性问题,我还是有些担心,希望能多做测试,确保稳定性。
MiniMax这款产品的外观设计让我眼前一亮,真想试试它的功能!
MiniMax的功能听起来很强大,真想亲自体验一下!
自我进化的龙虾让我想到了生物工程的未来,真希望能看到更多类似的创新!
希望在技术细节上有更多分享,用户体验和实际效能是关键。