Kimi和Minimax的算力危机:智能白菜价,却让你买不到!

算力危机:我们需要面对的真相

作者:象先志(钛媒体授权发布)

大家有没有发现,本地的AI算力风险越来越高,各大公司纷纷推出云端解决方案。

Kimi刚推出K2.5,我立马就订了199元/月的Allegretto套餐,想看看低配的KimiClaw能发挥怎样的效果。顺便也试了一下MiniMax的Coding Plan。

结果呢?Kimi经常跳出“高峰时段算力不足”的提示,任务跑到一半就掉线,真是让人无奈。而MiniMax那边更夸张,龙虾刚部署上去,我聊两句就掉线,API时不时还给我发限速警告。

花199块买了一张算力排队票,真是让人哭笑不得。

我翻了翻用户群,大家都在吐槽。一个MiniMax用户@客服:“今天已经连续掉线,聊两句就掉了。”客服居然建议检查本地网络。还有人发了终端截图,MiniMax的API直接返回限速错误,配图是一张“赛博牛马”的表情包:我就发了条消息,怎么就被限速了呢?

Kimi和Minimax的算力危机:智能白菜价,却让你买不到!

在小红书上也是,大家都在劝人下车。

简单来说,就是你花了钱,但算力不一定归你。什么时候能用上,真是看运气,因为高峰时限速太严重了。

那边的Claude限额一大堆,而我们这边限速频出。还是能工智人好,运行一天只需俩馒头。

Kimi和Minimax的算力危机:智能白菜价,却让你买不到!

说实话,算力紧缺早就不是新鲜事了。2月10日,Kimi因为算力问题宕机,官方回应简直像是在开玩笑:“嗯,正在找算力。要不先用DeepSeek吧。”这家公司融了超过20亿美元,手里还握着100亿现金,却在产品最火的时候让用户去用竞争对手的服务。DeepSeek自己也不好受,2月28日和3月5日接连宕机,服务器忙得不可开交。

2026年春天,国产AI似乎都进入了“用不了”的时代。

算力基础设施,提前兑现的代价

直观上看,“算力荒”似乎是禁令造成的。这虽然有道理,但并不完全准确。

禁令是背景因素,DeepSeek和Qwen这些模型早就面临资源约束,MoE架构本身就省算力。Kimi的总裁张予彤在达沃斯时说得很直接:“仅用美国顶尖实验室1%的资源,我们就做出了全球领先的开源模型。”

真正让基础设施承压的,是Agent。

Chatbot是一问一答,算力消耗可预测。而Agent完全不同——一个任务可能涉及几十上百次模型调用,规划、拆解、执行、反思、纠错,每一步都需要模型支持。长时间的上下文占用显存,工具调用让GPU空转。

Chatbot时代,GPU就像餐厅的服务员,一桌客人上完菜就去下一桌。但在Agent时代,服务员全程陪伴,从点菜到结账,思考菜单的时候也不能离开。同样数量的服务员,能服务的桌数大幅下降。

简单计算一下,Chatbot每轮对话消耗大约1,000到3,000个token。而Agent完成一个完整任务,比如使用龙虾进行深度研究,经过感知、规划、执行、反思等多个循环,中等复杂度轻松消耗10万token,复杂任务甚至达到百万级。

有开发者反映,单次OpenClaw的运行消耗高达800万token。再加上像K2.5 Thinking这样的推理链模型,思考过程中的隐藏token能让成本翻10到30倍。保守估计,从Chatbot到Agent,单次任务的算力消耗增加了30到100倍,极端情况下甚至超过1,000倍。

Deloitte的研究指出一个悖论:过去两年token单价降了280倍,但企业AI的账单却飙升——推理成本降了1,000倍,需求却猛增了10,000倍。

更重要的是,Kimi和MiniMax并不拥有GPU。

从财报来看,MiniMax的固定资产开支非常低,而Kimi虽然还没上市,情况也差不多,算力几乎全部依赖第三方云服务——这是轻资产模式,和OpenAI自建数据中心完全不同。Kimi的背后有火山引擎和阿里云的双轨支持:火山引擎从2023年起独家提供训练和推理方案,阿里则投了月之暗面8亿美元,其中一部分直接以阿里云算力结算。MiniMax的情况更复杂,阿里云、腾讯云、火山引擎都是它的供应商,早期招标会上三家竞争到两折的低价。

Kimi和Minimax的算力危机:智能白菜价,却让你买不到!

谁也没想到,随着龙虾的推出,token需求的爆发会如此迅猛。

Agent的出现让价格战的逻辑失效。“未来”变成了“现在”:原本缓慢补充基础设施的时间瞬间消失。

当用户在抱怨Kimi卡顿时,Kimi可能也在抱怨火山引擎和阿里云的不稳定。算力荒从芯片到云服务再到模型公司,层层传导,Kimi和MiniMax处在最底层,承受着各方压力的叠加。

上游能扛住吗?

信号已经出现了。今年3月,国内云厂商开始集体调价——AI算力和存储产品的价格普遍上涨,涨幅从个位数到30%以上不等。优刻得直接全系涨价。海外也不甘落后,AWS和谷歌云在部分产品上试探性涨价。SK海力士公开表示,2026年存储芯片价格持续上涨已成定局,DRAM库存仅剩约4周。二十年来“云服务只降不升”的定律,被AI需求打破了。

价格上涨的逻辑并不复杂。云厂商们在过去一年疯狂扩建AI算力基础设施,资本开支动辄数百亿,但AI业务的利润率仍然很低,远不能覆盖基建投入。Token调用量呈指数级增长——2026年2月国内主流大模型日均消耗合计达约180万亿——但出售Token的收入增速却赶不上建数据中心的速度。涨价并不是云厂商的贪婪,而是供应链成本上涨的无奈之举。

更麻烦的是设备折旧。AWS、Google Cloud和Azure在2023-2024年统一将服务器的折旧年限从3-4年延长到6年,集体节省了约180亿美元的年度折旧开支。然而,NVIDIA的芯片迭代周期仅有18-24个月——你今天花几千亿建的数据中心,里面的GPU可能两年后就不再是最优选择,但折旧却要摊6年。

连Satya Nadella都说:“我不想在一代芯片上背负四五年的折旧。”

看看算力市场的格局。火山引擎凭借豆包以日均63万亿Token领跑,占据公有云大模型调用量49.2%的份额,几乎独占一半市场。阿里云日均32万亿排第二,腾讯元宝28万亿、DeepSeek 22万亿紧随其后。但调用量第一和营收第一并不是同一家——根据Omdia的统计,阿里云以35.8%的营收份额稳居AI云市场第一,超过第二到第四名的总和。火山引擎赢在“轻”,而阿里云赢在“重”。

Kimi和MiniMax的算力命脉就掌握在这两家手里。MiniMax上市后,资本市场对Token增长的热情高涨——M2.5发布首周调用量猛增至3.07万亿Token——但每一个Token背后都是真实的推理成本。MiniMax 2025年全年营收预计不足8000万美元,调整后净亏损2.5亿,毛利率刚刚爬到25%。上游一旦涨价,这个刚刚转正的毛利随时可能被吃掉。

这些问题反映到C端,结果只有一个:要么继续承受涨价,要么面对限流。Kimi最低配置的Allegretto套餐已经要199元/月,几乎和包含Co-work及Claude Code的Claude Pro同价了。如果继续涨价,我们所说的“白菜价”智能将真的不复存在。

在这篇文章发布前,老虎证券刚刚传出消息,月之暗面正在考虑赴港上市。那么Kimi就需要正面回答一个问题:是继续租算力,还是自己购买设备,是保住利润率,还是保住用户?MiniMax已经站在聚光灯下,每一季财报都像是个照妖镜。Kimi手上虽然有100亿的资金,短期内不必担心资本市场的压力,但今天就传出了Kimi赴港上市的传闻。

Kimi和Minimax的算力危机:智能白菜价,却让你买不到!

如果传闻属实,那么Kimi和MiniMax真的需要认真思考一个问题:到底是保住用户,还是保住利润率。随着涨价链条的传递,大模型被“两头堵”的可能性正在急剧上升。

结语

2026年,Agent改变了算力的需求曲线。虽然便宜的智能没有变贵,但使用智能的方式却发生了变化,资源的紧张感愈发明显。

价格上调何时休?这波涨势似乎还没到头

说到涨价,短期内恐怕是难以停止的。Agent的需求曲线正在快速攀升——Kimi K2.5刚上线不到一个月,就已经超过了2025年的全年收入;而MiniMax M2.5发布的第一周,Token消耗量更是超过了三家竞争对手的总和。随着多Agent并行、长上下文推理和编程场景的兴起,我们才刚刚开始看到这种变化。每打开一个新场景,Token的消耗量就会再度攀升。而在供给方面,扩张周期却是以年为单位的——数据中心从规划到建成至少需要18个月,受芯片禁令影响,国产替代的产能提升速度也很缓慢。需求以周为单位增长,而供给却是逐年追赶,这就形成了涨价和限流的空间

更深层次的变化是,中国的云服务商们似乎正在被迫进入一个全新的重资产设备周期。过去二十年,云计算的故事都是“轻松”——弹性伸缩、按需付费、用多少买多少。但现在,Agent时代的算力需求把这一切都颠覆了。阿里巴巴宣布将在三年内投入3800亿建设AI基础设施,而字节跳动在火山引擎上的算力部署也同样积极。这些投入一旦开始,就很难停止——如果今天不建设,明天的Token就没法运作;但一旦建成,折旧和摊销将在未来五到十年内持续影响利润。

这感觉就像二十年前电信公司铺设3G和4G网络的情况:需求的暴增迫使巨额基建,而基建又带来了涨价或补贴的减少,最终整个行业的利润结构都被重塑。当年中国移动和中国联通经历的资本支出竞争,今天可能在阿里云和火山引擎的身上重演。不过,不同的是,电信行业有牌照保护和政策保障,而云服务商却没有。

对于站在链条最底端的Kimi和MiniMax们来说,这意味着算力成本不会回到价格战时期的底线价了。而对我们这些用199元套餐享受龙虾的人来说,这就意味着“便宜又好用的AI”窗口期,可能比大家想象中要短得多

想了解更多精彩内容,欢迎关注钛媒体微信号(ID:taimeiti),或下载钛媒体App

来源:百家号
原文标题:Kimi、Minimax 们的算力荒:智能白菜价,你买不到
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《Kimi和Minimax的算力危机:智能白菜价,却让你买不到!》有11条评论

  1. MiniMax的限速问题让我也想起了以前用过的某些云服务,真是花钱买罪受,最后还得自己想办法解决。

    回复

发表评论