硅谷程序员竟然疯狂“投喂”中国大模型,让人震惊!

中国AI模型崛起:便宜又好用,全球开发者的宠儿

最近,全球最大的AI模型API聚合平台OpenRouter发布了一组数据,真的是在国内外引起了不小的轰动哦。

截至2026年2月28日,这个平台上前十名模型的Token消耗量已经超过了28.7万亿,而其中国产模型贡献了超过14.69万亿,这是中国模型首次在单月Token调用上占据了超过一半,实力反超美国模型。

从周的数据来看,2月16日至22日,中国模型的周调用量达到了5.16万亿Token,而美国模型则降到了2.7万亿,中国的市场份额达到了61%。在调用量前五的模型中,中国的MiniMax M2.5、月之暗面Kimi K2.5、DeepSeek V3.2和智谱GLM-5占据了四个席位。

虽然接下来的一周,中国模型的调用量有所回落,超越的时间也不长,但能在全球最大API聚合平台上与美国模型进行正面竞争并短暂领先,已经足以证明其实力了。

此外,OpenRouter的用户中,美国开发者占了47.17%,而中国开发者只有6.01%。还有报告显示,80%的美国人工智能初创公司在开发产品时使用了中国的开源模型。

这说明,推动中国模型崛起的主力军,其实是来自硅谷和欧洲的海外开发者,而不是国内市场的自我陶醉。

因为大型模型的竞争已经不再是单一的“谁更聪明”,而是进入了“谁聪明、谁省钱”的多维比拼阶段。

一、真香定律:美国开发者为何青睐中国Token

中国的AI模型在全球调用量上超越美国,背后其实是多种因素叠加形成的系统性优势,而其中最直接的原因,就是价格便宜。

看看这些数据吧。

长江证券的研究报告显示,输入价格方面,MiniMax M2.5和智谱GLM-5都是0.3美元/百万Token,而Anthropic的Claude Opus 4.6则是5美元,竟然是中国模型的16.7倍。

输出价格更是夸张,MiniMax-M2.5的费用为1.1美元/百万Token,智谱GLM-5为2.55美元/百万Token,而Claude Opus 4.6的价格高达25美元/百万Token,分别是前两者的22.7倍和9.8倍。就拿最近发布的阿里Qwen 3.5来说,它的百万Token价格直接下降到0.8元人民币,相当于谷歌Gemini的十八分之一。

在很多日常场景中,尤其是随着Agent时代的到来,用户对便宜且强大的算力需求,已经压过了对“顶级智商”的需求。

今年2月,开源框架OpenClaw大受欢迎,AI开始从“聊天工具”变成能自己干活的“数字员工”。

一个Agent任务的Token消耗量动辄就有几十万到百万,按量付费的API成本一下子成了开发者的主要开支。月之暗面顺势推出了KimiClaw,支持一键部署,结果Kimi K2.5在发布20天内的调用量就超过了去年一整年的总和,收入也超越了2025年的总和。

硅谷程序员竟然疯狂“投喂”中国大模型,让人震惊!

这也是Google和Anthropic禁用那些在订阅制下进行全自动调用的账户的原因,因为订阅费用远远无法覆盖全自动调用的算力成本。

当消耗量呈指数级增长时,单位Token的价格优势便成了竞争的关键。

这种成本优势可不是凭空而来的,底层是电力和工程的支撑。

算力的底线就是电力。

中国工业用电的成本比美国低30%至40%,中西部的绿电甚至低50%至70%。再加上中国的工业用电基数大,可以充分利用谷电来训练模型,这就形成了中国AI企业的物理成本护城河。

另一方面,工程能力的提升也是被迫的。从2024年4月起,中国AI企业在尖端芯片供应受限的情况下生存,拿不到最好的芯片,就把现有的芯片用到极限。

中国模型普遍采用混合专家架构,这种技术路线重构了算力消耗的逻辑。一个几千亿参数的模型在处理简单问题时,只激活其中一小部分“专家网络”,这种“按需激活”的模式不仅省电,还节省算力。

最后,开源生态的良性循环也在持续进行。

过去一年,中国大模型在全球的Token消耗占比增长了421%。斯坦福的报告显示,从2024年8月到2025年8月,中国开发者贡献了Hugging Face总下载量的17.1%,略高于美国的15.8%。

开源生态降低了全球开发者的使用门槛,也让中国模型在技术反馈中迅速迭代,能力和价格的综合优势在不断扩大。正如硅谷投资人Aditya Agarwal所说:“超过50%的大模型调用都是通过廉价的开源模型完成的,中国的模型实际上支撑了大部分AI应用,美国同行甚至无法替代。”

中国AI模型的出海成功,是技术架构创新、极致成本控制、开源生态和场景适配共同作用的结果,体现了系统性优势的集中爆发。

二、出海模式:从应用到算力、生态

如果说调用量的数据展示了中国AI的“强大”,那么接下来要聊的是:这些Token到底是怎么流向全球的呢?

过去几年,中国AI出海的主要方式是“应用输出”,也就是说把AI能力封装成APP,送到海外用户手中,比如字节的Gauthmath、美图的影像产品、快手的KLING AI,都是走这一条路。

如今,这条路依旧为企业带来可观的用户规模和收入。

以Talkie为例,这款情感陪伴类应用覆盖全球200多个国家,在北美Z世代中的渗透率持续提升。用户在与AI角色聊天的过程中,每一句话都在消耗Token。这类C端收入占Minimax收入的70%以上,并且还在快速增长:2026年2月的日均Token消耗量达到了2025年12月的6倍以上。

字节的Gauthmath在美国的拍照搜题市场中拿下了47%的市场份额,成功替代了老牌产品Mathway,也是同样的逻辑。

这种模式不直接按Token向用户收费,而是通过订阅、内购和广告来实现变现。但从底层来看,它们依然消耗的是中国的算力,构成了中国AI出海的“用户基础”。

如果把AI出海比作一条产业链,那么应用就是下游,算力则是上游。中国企业先在下游做产品和流量,然后再向上游发展,做基础设施。

一方面,通过API管道式输出,直接把算力做成水电煤。

海外开发者通过OpenRouter等聚合平台调用中国大模型的API,推理在中国本土的数据中心完成,按Token付费。整个过程,算力和电力都不出境,只有价值通过Token实现跨境交付。

这就像是典型的“卖水卖电”的生意。开发者无需自己部署模型,也不用购买显卡,就能让应用在中国的模型上运行。

据报道,月之暗面负责API服务的团队近期快速扩编,并以独立业务分支的形式直接向总裁张予彤汇报。这样的组织调整足以说明API业务的重要性正在迅速上升。

从商业角度来看,这种模式的优势在于可规模化,且利润率可观,而且随着Agent时代的到来,单次任务的Token消耗量呈现指数级增长,API业务的潜力也在不断扩大。

另一方面,通过构建开源生态,为算力输出铺路。

阿里通义千问、DeepSeek系列选择了一条看似“免费”的路径:把模型权重、工具链和工程范式全部开源,海外开发者可以免费下载并在本地服务器上部署。

这个免费的策略旨在让中国模型进入全球开发者的默认工具箱,成为他们技术栈的一部分。当开发者熟悉了开源模型后,未来开发商业应用时,自然会优先考虑调用同系列的API。

基于阿里和DeepSeek开源模型的衍生模型上传量,已经超过了基于美国主流模型的数量。这意味着全球开发者正在中国开源模型的基础上,发展出一个庞大的技术生态。一旦生态形成,迁移成本将非常高。

可以说,如今的中国AI出海已经不再是单一的“应用输出”,而是一个三层结构:底层是开源生态,通过开放换取开发者的心智;中间层是API算力输出,直接把Token卖给全球开发者,成为商业化的核心引擎;顶层是应用输出,通过产品触达终端用户,既是流量入口,也是算力消耗的重要场景。

这三层相互支撑,共同表明中国的算力正在成为全球AI的基础设施。

三、下半场考验:商业优势面临规则壁垒

OpenRouter平台的数据确实吸引眼球,但它并不能代表全部的情况。

在消费级市场(开发者、初创公司、Agent应用)中,决策链条较短,核心指标是性价比和上手速度。开发者选择哪个模型,往往是他们自己说了算。在这种情况下,中国模型的“便宜且量多”无疑是绝对优势。

但企业级市场可就不一样了。政府、金融、医疗和关键基础设施的决策链条很长,涉及合规、安全、审计和供应商稳定性等多重因素。

在海外的企业级市场,这种复杂性更是显而易见。

因此,有一个问题无法避免:在国际竞争中,单靠纯商业的竞争优势,比如好用、成本低,可能还不够。

比如,之前的英伟达H200被禁止出口。尽管现在可以重新进口英伟达H200,但在AI竞争上,美国的政策随时可能出现反复,而当前推理集群还是依赖于英伟达的H100/H200。

当然,封锁有其双面性,一方面会导致训练成本上升,模型迭代速度放缓;另一方面,也正是这种背景,迫使工程优化提升效率,国产芯片也取得了进展。

但风险同样存在。银河证券的研究报告指出,全球模型的迭代周期正在缩短,主流模型的更新频率已经从半年缩短至数月。如果核心能力的提升速度放缓,成本优势在高端市场可能迅速失去吸引力。

摩根士丹利首席经济学家邢自强认为,Token出海肯定是有市场的,但不要过分夸大中国开源大模型和Token出海借助电力优势的前景,而忽视了地缘政治和安全的考量。

他举了个例子:中国在5G设备领域同样具备性价比和技术优势,但从2018年、2019年后,欧美不少电信网络中的中国5G基站仍然被替代了。

AI出海的挑战与机遇:不止于成本优势

在企业市场中,那些对价格特别敏感的中小企业可能会被中国模型的高性价比吸引,但在政府、金融、医疗等涉及数据主权和关键基础设施的领域,准入的标准可不是单靠“便宜”就能打动的,而是要看“合规性、信任度和品牌影响力”。

美国正在通过投资审查、制定标准以及数据主权相关的法规,逐步提高企业市场的准入门槛。

这意味着,地缘政治的限制正在逐渐增强。

到2025年12月,美国政府提出了所谓的“硅和平倡议”,声称要把那些拥有顶尖科技企业或其他资源的国家联合起来,从而确保“供应链的安全”。

专业人士认为,这实际上是在试图通过规则、投资和项目清单来重塑全球技术分工与资金流向,看似是在构建新的生态,实际上却是一种排他性的整合方式。

至于这个“他”指的是谁,自然不言而喻。

从芯片封锁到“硅和平倡议”,美国的策略是通过规则输出和遏制发展,来重新定义游戏规则、巩固话语权。

因此,模型调用量反超虽然是个阶段性的成就,但这也只是故事的一部分。

AI出海的下半场,除了要保持成本优势,还得面对更多更复杂的问题。有些问题可以通过提升模型性能、系统效率和竞争力来解决,但也有些问题是没有现成答案的。

想了解更多精彩内容,欢迎关注钛媒体的微信号(ID:taimeiti),或者下载钛媒体App!

来源:百家号
原文标题:硅谷程序员,疯狂“投喂”中国大模型
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《硅谷程序员竟然疯狂“投喂”中国大模型,让人震惊!》有10条评论

发表评论