就在刚刚过去的一周,全球最大的API聚合平台OpenRouter上,突然冒出两个神秘的代号为“Hunter Alpha”和“Healer Alpha”的黑马。没有任何预热,也没有发布会的PPT,这两个模型就这样一跃而上,夺得了日榜第一,调用量在短时间内直接突破了1万亿Tokens。整个开发者社区都沸腾了,大家普遍猜测这可能是DeepSeek V4的内测。毕竟,像这样的顶尖性能,想低调又能做到的,除了深度求索,谁还会呢?连OpenClaw的创始人Peter Steinberger都亲自出马,在X平台上打听这到底是什么东西。

但就在3月19日的凌晨,事情发生了大逆转。小米官方终于揭开了这个谜团:根本不是DeepSeek V4,而是他们自家的MiMo-V2-Pro和MiMo-V2-Omni!原来被大家误解了一周的荣誉,竟然是雷军给大家埋下的一个大坑。
如果你以为这只是一次普通的版本更新,那你就太小看小米的野心了。这完全不是简单的技术迭代,而是一场针对“智能体时代”早已策划好的战略战役。小米MiMo大模型的负责人罗福莉在官宣后发表了一篇长文,其中有一句话特别有趣:“我称这是悄无声息的伏击——不是因为我们有计划,而是因为从Chat到Agent的转变来得太快,连我们自己都几乎不敢相信。”
这次亮相的三款模型,每一款都不容小觑。

第一款是MiMo-V2-Pro,大家猜测的Hunter Alpha。这款模型的参数量超过1万亿,虽然激活参数控制在42B,但通过创新的混合注意力架构,让上下文窗口被拉到了惊人的1M。这就意味着什么呢?它可以一次性处理三本《三体》的内容,并进行逻辑推理。在全球的Artificial Analysis综合排行榜上,它直接拿下了全球第八、国内第二的好成绩,使用体验已经超越了Claude Sonnet 4.6,正逼近Opus 4.6的水平。不过,最让人惊讶的是它的定价。它的API收费仅为同类竞品的五分之一,每百万tokens的输入价格最低只有1美元,直接把大模型的价格战打到了对手的门口。
第二款是MiMo-V2-Omni,代号Healer Alpha的全模态模型。如果说Pro版是大脑,那么Omni版就像给这个大脑加上了眼睛、耳朵和手。它支持超过10小时的连续长音频理解,在音频理解的表现上甚至超越了Gemini 3 Pro。而真正让业内人士惊讶的是它结合OpenClaw框架展示的那套“骚操作”。就像真人一样,它能操控浏览器,浏览社交媒体的评测内容,整理购买建议,切换到京东进行跨店比价,甚至能联系客服帮你砍价,最后完成下单。当遇到多标签页切换、实时弹窗时,它也能应对自如。这已经不仅仅是问答了,而是AI开始真正具备“动手能力”。
还有第三款,MiMo-V2-TTS。这款语音合成大模型经过上亿小时的语音数据预训练,能智能识别标点符号、语气词和强调标记,并将其转化为自然的语音表达。官方甚至展示了它能唱歌、模仿方言(东北话、四川话、粤语都没问题),还能在同一句话中完成语气的转折和情感的变化。想象一下,如果你车里的导航语音从生硬的“前方300米右转”变成了略显疲惫却又不得不提醒你的“老板,前面右转,我刚帮你比了价,这箱油加得有点亏”,那交互体验可就完全不一样了。
技术参数讲完了,咱们再聊聊更劲爆的。

罗福莉在这次发布中提到一个细节,特别值得关注。她表示为了推动团队向Agent范式转型,给了一个死命令:MiMo团队中,明天对话次数少于100次的成员可以辞职。这个指令听起来有点极端,甚至有些“狼性”,但信号非常明确——小米内部对于AI的未来已经有了绝对的共识:不能再沉迷于只会聊天的“人工智障”,而是要转向能真正干活的“智能体”。
事实证明,这种高压策略是有效的。一旦团队的想象力受到智能体系统能力的激励,研究的速度就直线上升。罗福莉自己总结过为什么小米能发展这么快:基础设施需要长期投入,得有一年的战略决心才能看到回报;但训练后的敏捷性则是一种能力,它需要产品直觉驱动评估和极短的迭代周期。小米现在正好把这两种能力结合得淋漓尽致。
当然,单有技术还不够,还得有实际应用场景。这也正是小米这次让竞争对手感到心惊肉跳的地方。当其他AI公司还在四处寻找场景、求合作时,小米直接打开了自己的“武器库”:这些模型已经全面落地到Xiaomi miclaw、MiMo Studio、金山办公、小米浏览器。是的,你没听错,金山办公。MiMo Claw模块现在已经全面接入金山WebOffice生态,原生支持Word、Excel、PPT、PDF四大主流格式,覆盖超过95%的日常文档类型。WPS灵犀已经接入了MiMo-V2-Pro,这意味着什么?意味着几亿的打工人未来可能在WPS里遇到的AI助手,背后就是这匹黑马。

别忘了还有小米汽车,以及米家IoT那超过10亿台的设备。小米长期推进的“人车家全生态”战略,通过澎湃OS早已将手机、汽车和智能家居设备在物理上打通。以前缺的是什么?缺的是一个能够跨设备理解意图、自主规划并完成任务的智能中枢。现在,这个中枢来了。MiMo-V2-Pro负责推理与规划,Omni负责多模态感知与执行,而TTS则负责有温度的语音表达。这三者的结合,构成了驱动整个生态运转的完整AI能力栈。
高盛今天发布的一份研究报告也注意到了这一点,直接把小米重新定义为“物理AI领导者”。这个定位非常有趣。它并不是把AI当作一个APP装在手机里,而是要将AI变成整个硬件生态的操作系统。
从OpenRouter上那个无人知晓的匿名模型,到今天凌晨这个三连击震惊业界,小米用一周的时间上演了一场教科书级别的“伏击战”。回想雷军早前说过的话:“在AI领域,我们今年的研发和资本投入将超过160亿元。我相信,只要我们持续投入,小米在AI时代一定能交出一份精彩的答卷。”
这个曾被视为“组装厂”的小米,这次真的是把底牌亮出来了。而且这张牌的点数,可能比所有人想的都要大。












雷军这波操作太绝了,居然搞得大家都在猜测DeepSeek,真是个营销高手!
这次小米的发布会真是让人惊讶,没想到会是他们自己的产品!
从文章来看,MiMo系列的能力确实惊人,尤其是处理长文本方面,我能想象这会如何改变内容创作。
MiMo系列的能力真是超乎想象,特别是对长文本的理解,未来会变得更加智能。
小米的战略布局让人期待,是否会在AI领域引发更大的变化?
小米的这次战略布局,是否意味着他们将全力进军AI市场?会不会有更多的惊喜?
MiMo-V2-Pro的表现真是让人惊讶,价格也太有竞争力了吧,这会不会引发价格战?
小米这次的发布让我想起了之前的技术产品,期待他们能继续保持这种创新能力。
看到小米的产品,我不禁想起了AI与生活的结合,未来或许会变得更加便捷。
MiMo-V2-Omni的多模态能力真是让人惊叹,未来我们能否看到更多类似的产品?