我们真的跟上这场 AI 革命了吗？小七的看法让人深思！

欢迎大家讨论，发现问题请随时指出哦

2025年下半年，大模型的商业化进入新阶段

叠甲：这可不是随便说的，我有经过验证的资料和数据作为支持，有关的采访和来源都在下面列出来了。

不想看太长的可以直接看结论，想了解详细数据的可以往下翻：

下半年LLM的发展可以分为性能和商业化两个主要方向。你可能会问，为什么还要提性能？其实，刚结束上半年时，我以为性能的影响力会减弱，但现在看来却并非如此。相比上半年各家都在全面进展，下半年大家似乎各自碰到了不少难题，也因此在商业化方面做出了不同程度的让步。在这样的背景下，性能的重要性可能会再次上升。

你可能感兴趣：字节的新AI IDE工具Trae，竟然能与Cursor一较高下！实际体验到底如何？来听听程序员昊天的看法吧！

OpenAI一度被认为是没办法再突破（可能只有我这么觉得），GPT5在编程之外的领域几乎没有太大进展，提升大约只有10%。但之后GPT5的使用量却突飞猛进，GPT5-codex、Sora2和电商等举措证明了OAI依然不容小觑，目前他们在商业化的进展上也是最快的；
上半年的领导者谷歌在图像领域放出了nano-banana这一强力干扰，但在LLM市场上却沉默了将近半年，除了对Flash系列的简单更新，旗舰模型也没有新消息；
xAI的更新速度真的是惊人，Grok4在被吐槽后悄悄推出了Grok4 Fast，上下文达到2M，输出速度200tps，成本仅为0.2美元，竞争力极强；
Deepseek最近遇到了一些麻烦，v3.1和v3.1T在性能上有所提升但也有下降，v3.2带来了小惊喜，成本大幅降低，性能仅降约5%，但面对16倍上下文窗口的Grok4 Fast，价格还便宜1/3，他们还需要努力；此外，DS似乎明确了自己的研究机构定位，几乎放弃了商业化，根据similarweb的数据，他们的官方平台和元宝的总流量已经减半，月活跃用户也大幅下降。
不能单靠OpenRouter的数据说明问题，以前国模在OR上迅猛发展并不代表现在国模统治市场；同样，现在国模在OR上的表现不佳也不代表他们彻底衰退。
国模也需要开始探索商业化，比赛圈已经缩小到六家小龙；百川和零一基本上已经退出了大模型的竞争，阶跃的情况仍不明朗，MiniMax在多模态方面表现出色，但几乎不再参与LLM的竞争。智谱和Kimi表现最佳，但依靠编程API的收入远远无法覆盖支出，尤其在Grok追赶的势头强劲，Codex和Claude依旧保持着强大的市场控制力。

综合性能与推理效能

单一的benchmark指标很难全面衡量LLM的能力，所以之前我一直想通过市场表现来侧面反映LLM的实力，但在下半年的特殊形势下，单靠市场表现来判断并不准确，比如OpenAI在商业化方面表现突出，而Deepseek则放弃了商业化；所以结合综合性benchmark和市场表现来评估才更为合适。

OpenAI

GPT5意味着OpenAI彻底放弃了追求AGI的伪装，回归现实，追求性价比的GPT5牺牲了大参数，使得写作和对话的表现都不如以往；成本控制也到了令人咋舌的地步，连获得IMO、IOI金牌的通用推理模型strawberry，甚至比GPT5更强的o3-alpha和Zenith都被搁置了，GPT5的表现甚至不及其内测版Horizon系列。

不过，能把一个中小参数模型榨取到这种地步，真不知道该说OpenAI有实力，还是该骂他们太抠了。

谷歌

根据Artificial Analysis综合性benchmark的数据，已经7个月没有更新的旗舰Gemini系列显得有些落后，虽然在知识量和语言能力上依旧强大，但在Agent能力和编码方面却已经对GPT5和Claude4.5感到吃力；但谷歌又放出了nano-banana这一图像领域的强力干扰，所以我现在很疑惑，谷歌是否还有能力给我们带来一个惊喜的Gemini3？

Anthropic

没啥特别的，常规迭代和商业化，表现稳妥，除了Dario这个“魔怔”的人，整体表现平稳。

xAI

自2025年起，他们已经发布了Grok2、Grok3、Grok3 Mini reasoning、Grok4和Grok4 Fast，年底还会有Grok5…老马把SpaceX的做法搬到了LLM领域，虽然还有些粗糙，但这种追赶速度确实很快，Grok4 Fast也显露出了一些方向。

Deepseek

DS最近不太顺利，v3.1出现了严重的bug，v3.1t虽然有所提升但也有些退步，v3.2在性能减少5%的情况下换来了75%的成本下降，但面对比v3.2还便宜1/3的Grok4 Fast，他们还得加把劲。

此外，谈到未来的Agent应用，除了关注绝对性能，也得考虑推理效能。参考SuperCLUE的推理能效图，可以明显看出，即使在中文测试中，国模依旧有个小问题：用极长的思考时间和思维链来提高回复质量。

现在Deepseek已经意识到了这个问题并开始尝试改变，GLM-4.6也在做出调整，其他公司还没有明显反应。

商业化

在我修改这一部分的时候，没想到OpenAI的动作会这么快，迅速推出了一系列商业化举措，不过这些举措的效果如何，我们还需慢慢观察。

目前大模型已经在多个领域实际落地应用，这证明了大模型的营收能力初步显现：

AI编程市场：Claude Code、Cursor、Codex；
AI搜索市场：GPT5、perplexity；
生图P图市场：nano-banana（Gemini 2.5 Flash Image）、Flux；
通用助手订阅市场：chatGPT、Gemini。

OpenAI

截至2025年10月，OpenAI的年化收入达到了130亿美元，以194%的增长率和最近的5000亿估值来看，其PSG已达到0.198，虽然距离泡沫还有一段距离，但这种依靠投资的方式是不可持续的（国模也是如此！）OpenAI急需推进商业化，他们的新市场CEO（CEOofApplications）Fidji Simo就是专门负责这方面的。

OpenAI Dev Day 2025上，Sam官宣周活跃用户达到了8亿，API每分钟调用量超过60亿tokens

目前，OpenAI在多个领域推进商业化，包括：电商（联合Shopify、Etsy）、短视频加持的Sora App、主动内容推送Pulse、通用助手chatGPT、AI编程Codex等。

chatGPT与Codex的初步成效已经显现，Sam透露，Codex在过去一个月的使用量翻了30倍，但其他几项仍需长期观察。

目前OpenAI已经签署了三份超级订单：

Oracle的5年订单，总额约3000亿美元，4.5GW（虽然未正式公布，但多家媒体已报道）
NVIDIA的10GW的NVIDIA系统
AMD以MI450为核心的6GW系统

不知道超级订单的前景如何，但我个人并不看好OpenAI和Oracle的天价合同。Oracle并不是英伟达，也不是AMD，目前看来OpenAI根本无法支付Oracle的3000亿，而Oracle也很难提供OpenAI所需的庞大算力。这份订单显然不如OpenAI与英伟达、AMD那两份较小的订单更具意义。

数据来源Xsignal

5月份，OpenAI的年度经常性收入（ARR）达到了100亿美元，7月份ARR达到了120亿美元。

OpenAI的收入主要来源于三个渠道：个人订阅、企业订阅和API服务。
个人订阅已经成为OpenAI的主要收入来源，从2024年1月的占比52.09%到2025年4月的68.51%，个人订阅的占比显著提升，月收入也从1.25亿增长至4.85亿，显示用户对OpenAI产品的高度认可，商业模式也在日益成熟。
2024年12月的同比增长率达到了251.67%，远超同期MAU的增长（103.88%），这说明ChatGPT的付费渗透率在不断提升。进入2025年，前4个月保持了强劲增长（34.04%）。
个人订阅的ARPU从2024年1月的0.703美元/用户增长到2025年4月的0.792美元，增长了12.66%。换句话说，大家更愿意为OAI付费了。要注意的是ARPU的提升是叠加在OAI的庞大用户基础上，因此即使是微小的提升也显得非常可观。

到5月，OpenAI的全端月活跃用户达到了10亿，与TikTok等平台达到同一量级，正式成为世界第五大流量网站，成为入口级平台之一。自4月1日起，ChatGPT为免费用户提供了每天最多生成3张图像的功能，并向所有用户免费开放了深度研究（Deep Research）功能，成功吸引了大量新用户，单月活跃用户增长超过1亿！

揭开误区：OpenAI API市场表现并不差！

我们先来聊聊一个常见的误解：最近关于OpenRouter的数据让大家觉得OAI在API市场上不太行，其实这只是片面的数据误导罢了。

进入2025年，OpenAI的API业务开始明显回暖。就拿2025年1月至4月来说，API的营收同比增长了58.25%，总收入跃升至6600万美元，占公司整体收入的比重也回升到了9.30%。

谷歌DeepMind的表现

这部分数据来源于谷歌的官方财报

Sundar Pichai，首席执行官：

正如大家在Google I/O大会上看到的那样，我们在人工智能领域处于领先地位，进展速度让人惊叹。AI正在积极推动公司各个业务的发展，本季度，搜索业务实现了两位数的收入增长，新推出的搜索功能反响也很好。

另外，Veo 3这个先进的视频生成模型也引起了热潮，用户们在Gemini应用中分享自己制作的视频，搭配我们的新AI电影制作工具Flow。

自5月以来，已经生成了超过7000万个视频。我们最近在Gemini中推出了将照片转为视频的功能，用户们的反馈非常好，今天这个功能开始向Google Photos用户开放。

在5月的I/O大会上，我们还宣布，每月处理480万亿个tokens的服务。从那时起，这一数字已经翻了一倍，目前每月处理超过980万亿tokens，增长速度真是惊人。

Gemini应用的月活跃用户已经超过4.5亿，我们依然看到强劲的增长和用户参与度，每日请求量比第一季度增长了超过50%。

Anthropic的发展

数据来源于sacra

Anthropic在2025年7月达到了40亿美元的年化收入，相比年初增长了近4倍，6月时年化收入为30亿美元。尽管运营成本很高，该公司的月收入依然达到了3.33亿美元，显示出强劲的增长势头，预计2025年的现金消耗将达到30亿美元。

可以说，Anthropic在这一轮AI编码浪潮中大获全胜，几乎占据了Coding市场的一半。由于他们高昂的定价和较少的免费额度，Anthropic可能是离盈利最近的一家。

Poe2025年春季人工智能模型使用趋势报告（5.13）

通用模型（包括推理模型）

Deepseek的市场份额从1月的7%骤降至5月的2.3%

而OpenAI和Anthropic依旧占据了超过80%的通用市场，OpenAI的市场份额还在逐步上升，结合月活跃用户和访问量的飙升，已经成为市场的绝对领导者。

推理模型

从推理模型来看：Deepseek的市场份额从2月的50%暴跌到12.2%，即便在5月o3未降价80%的情况下，Deepseek面临的压力可谓前所未有。

Gemini 2.5 Pro则是最近的黑马，在短短30天内从4月到5月就达到了31.5%的市场份额。

最近发生了两件重要事件：

o3的价格降了80%，现在比Gemini 2.5 Pro和GPT 4o还便宜！
Deepseek R1 0528更新后未能像2月那样引起热潮，国内反响也不大。

AI生图

GPT 4o的原生生图已经火遍网络，成为AI生图领域的标杆，谷歌的Imagen3表现也不逊色，但Flux凭借开源社区的优势和完善的工作流程，成为市场的霸主。

AI视频

作为中国AI市场的一员，灵迅迅速崛起，市场份额不断上升。

不过在图表截止的两天后，谷歌在I/O大会上重磅发布了Veo3和配套的Flow平台，让谷歌的市场份额大幅提升。

总访问量：

OpenAI：

在总访问量这个关键指标上，自Deepseek开源以来，OpenAI一直被认为要掉队，但2025年ChatGPT的流量不仅是Deepseek的12倍，还是第二名的7倍以上，月访问量竟然达到了惊人的55亿次。

Deepseek：

事实上，自从2月达到峰值后，Deepseek的官网和腾讯元宝的总访问量一直在迅速下滑，而且跌幅还在不断扩大，最近甚至接近两位数的下降幅度。

Google：

DeepMind最近发布了一系列新产品，3.25推出2.5pro，4.17推出2.5flash，5.4推出AlphaEvolve，5.6推出2.5pro更新和Veo3（超强视频SOTA），5.20推出2.5flash更新，6.5推出2.5pro更新和Gemini 2.5 Pro TTS与Gemini 2.5 Flash TTS，lyria-realtime-exp。

因此，毫无疑问，Gemini的增长就像坐上火箭一样，今年以每月20%的增速飞速发展（还不算在AI Studio的免费使用），现在已经超越了Deepseek。

其他中国选手：

比较遗憾的是，在全球前30名的榜单上，只有4家中国AI应用，分别是Deepseek（前10），WPS（前20），夸克（24）和豆包（30）。

夸克和豆包甚至已经接近被淘汰的边缘，而被认为最有潜力的Kimi自从停止投放广告后，从前30名一路滑落，现在榜单上已经看不到他们的身影，他们自己也坦承：停了广告后，从千万级的月活跃用户掉到了百万级。

数据

2025年6月网页访问量

排名	产品名称	月访问量 (亿次)	增长趋势	备注
1	ChatGPT	53.95	▼ – 1.77%	这家伙终于放慢了脚步，真是让人意外
2	Canva	7.91	▼ -6.32%	继续下滑，得加把劲了
3	Gemini	6.48	▲ +22.89%	简直太猛了，持续逆袭
AI Studio	0.84	▲ +10.86%	与Gemini同属一家公司
4	OpenAI	6.47	▲ +0.68%	稳步增长，没啥大变动
5	DeepSeek	3.86	▼ – 11.54%	下滑幅度越来越大，情况不容乐观
6	Tailor by Threads	2.07	▼ -5.47%	似乎也在挣扎中
7	DeepL	1.78	▼ -5.86%	持续微跌中
8	Character AI	1.81	▼ -3.39%	小幅下降，保持稳定
9	Grok	1.58	▼ -11.35%	跌幅不小，得小心了
10	Notion AI	1.55	▼ -2.25%	波动不大，继续观察
21	夸克	0.84	▲ +0.16%	小幅上升，表现稳定
25	豆包	0.60	▲ +6.95%	表现不错，值得关注
32	Qwen（通义千问）	0.31	▼ -28.83%	骤降，令人费解
45	腾讯元宝	0.24	▲ +3.86%	小幅回升，期待后续表现
Kimi+新网址	0.24+0.03	▼ -6.8%	波动幅度不小，值得关注
54	Kimi	0.03	▼ -82.73%	更换网址后表现不佳
文心一言	0.07	▼ -17.28%	继续下滑，亟需改进

排名	产品名称	月访问量 (亿次)	增长趋势	备注
1	ChatGPT	54.92	▲ +6.82%	依然是领头羊，持续增长中
2	Canva	8.44	▲ +8.36%	维持增长，表现不错
3	OpenAI	6.42	▼ -8.38%	小幅下滑，需保持关注
4	Gemini	5.28	▲ +28.90%	继续强劲，增长势头不减
AI Studio	0.76	▲ +11.65%	同为Gemini的兄弟网站
5	DeepSeek	4.13	▼ -8.38%	持续下滑，速度加快
6	Tailor by Threads	2.19	▲ +558.13%	大幅提升，表现惊人
7	DeepL	1.89	▼ -1.01%	轻微下滑，保持稳定
8	Character AI	1.87	▼ -0.14%	小幅波动，持续观察
9	Grok	1.79	▼ -8.92%	下滑趋势显著，需注意
10	Notion AI	1.59	▼ -0.34%	稳定中，表现平淡
21	夸克	0.84	▲ +8.49%	小幅上升，值得关注
25	豆包	0.57	▲ +7.1%	保持增长，继续加油
32	Qwen（通义千问）	0.44	▼ -3.57%	小幅回落，需改进
45	腾讯元宝	0.23	▼ -19.42%	显著下滑，需警惕
Kimi+新网址	0.19+0.10	▼ -9.38%	波动不小，需关注
54	Kimi	0.19	▼ -40.7%	表现不佳，需调整
文心一言	0.08	▼ -21.64%	持续调整，亟待改善

排名	产品名称	月访问量 (亿次)	增长趋势	备注
1	ChatGPT	51.42	▲ +13.04%	继续稳居榜首，增长强劲
2	Canva	7.79	▼ -1.84%	轻微下滑，需保持关注
3	OpenAI	7.01	▲ +25.40%	逆势上扬，表现出色
4（+2）	DeepSeek	4.48	▼ -5.23%	下滑趋势明显，需警惕
5（+2）	Gemini	4.09	▲ +19.36%	增长势头强劲，继续关注
AI Studio	0.68	▲ +15.70%	同属Gemini的一个网站
6（+2）	Grok	1.96	▼ -3.22%	小幅波动，需继续观察
7（+2）	DeepL	1.91	▼ -5.66%	微跌，保持稳定
8（+2）	Character AI	1.87	▼ -3.34%	保持平稳，继续观察
9（+2）	Notion AI	1.60	▼ -0.11%	波动不大，继续关注
10（+2）	Shop	1.33	▲ +4.78%	稳定增长，值得期待
11（+1）	Notato	1.17	▼ -2.79%	小幅下滑，保持关注
12（+1）	Perplexity	1.13	▼ -8.77%	下滑速度加快，需关注
13（+1）	Freepik AI	1.03	▼ -7.30%	轻微下降，需调整
14（+1）	Janitor AI	1.00	▼ -2.23%	小幅波动，需继续关注
15（+1）	Claude	0.96	▼ -5.41%	表现平平，需努力
20	夸克	0.77	▼ -7.45%	轻微下滑，需保持关注
26	豆包	0.53	▲ +3.39%	小幅上升，表现稳定
29	Qwen（通义千问）	0.45	▲ +1.00%	小幅回升，期待后续发展
35（-4）	Kimi智能助手	0.32	▼ -20.40%	显著下滑，需警惕
39（-3）	腾讯元宝	0.28	▼ -23.43%	持续下滑，需关注

中国AI初创企业现状

Manus的转型之路

说到Manus，这家公司的变化真是令人关注。今年6月，产品负责人张涛透露，他们已经把公司总部从国内迁到新加坡。

目前，Manus的海外版主要依赖美国的初创企业Anthropic开发的Claude模型。虽然Manus可以用中文操作，但令人失望的是，中文版至今还没有推出。

在中国区，Manus大约有120名员工。大部分核心技术团队已经前往新加坡，剩下的员工则面临裁员，不过公司会给予N+3或2N的补偿。

最近，Manus在新加坡开始招聘新员工，岗位包括AI工程师、数据科学家和软件开发经理，薪资在8000美元到16000美元之间，折合人民币约11万元每月，年薪超过130万元。

此外，Manus刚刚完成了一轮由硅谷风投Benchmark领投的融资，金额达到7500万美元（大约5.4亿元），估值则高达5亿美元（约36亿元）。

中国AI六小龙面临挑战

一些行业采访摘录

零一万物的现状

零一万物的CEO李开复博士和COO黄蕙雯就行业内的一些问题进行了探讨。

问：最近大模型的ToB商业化团队不少被调整，是什么原因？零一万物对于商业化的未来怎么看？

李开复：其实，整个大模型行业在ToB市场遇到了一些挑战。一方面，中国还没有真正经历过ChatGPT那样的时刻，企业从模型中获得的价值还不够显著。另一方面，很多模型厂商为了争取订单，纷纷降价，导致利润微薄。

问：零一万物会继续投入进行底层模型的迭代吗？

黄蕙雯：我们已经明确表示，不再开发超大参数的巨型模型。现在的重点是如何将AI真正推向市场，让大家不仅仅是谈论AI，而是真正能够使用它。

不过，零一万物的技术团队似乎也面临着动荡，负责核心技术和产品的高管接连离职，最近一位是模型预训练负责人谷雪梅。到2024年底，预训练算法团队和Infra团队将被裁撤，出海的六个To C项目组也在逐步关闭或合并。

百川智能的挑战

王小川创办的百川智能同样经历了技术团队的动荡。今年3月，负责AI大语言模型开发的联创陈炜鹏离职，另一位联创焦可也随之离开。

月之暗面Kimi的变化

某六小龙的市场人员黄嘉（化名）表示：“去年每个月还能投入几百万到千万用于投流，今年都转向了海外市场。”

他说，去年单月投流过亿的月之暗面在今年2月停止了投流，而他所在的小龙在去年就已经停止了投放。靠自然流量，现在AI原生APP的月活跃用户已经降到了百万级别。

在这样的低迷环境下，智谱AI、MiniMax、阶跃星辰三家公司虽然没有公开宣布放弃预训练，但在追赶OpenAI的进程上明显减缓了脚步。

AI行业动态：从巨头到小玩家的最新动向

说到智谱AI，这位清华系的“学霸”，最近的动态可真让人有点失望。最后一次更新停在了2024年12月，当时推出了深度推理模型GLM-Zero-Preview。进入2025年后，智谱似乎只发布了个开源的GLM-4-32B-0414系列模型，其他动静都没有。月之暗面在1月20号推出的Kimi1.5推理模型热度被DeepSeek R1盖过，之后也没有新的更新。而跃阶星辰在2025年1月一周内集中推出了六款模型，之后就再也没有新消息了。

即使是还在持续更新的MiniMax，也只是在5月推出了MiniMax Speech – 02，专注于文本转语音的应用场景，似乎没有太大突破。

更糟的是，从2024年下半年开始，智谱以外的公司几乎也没有融资的好消息传出，整个行业显得有些呆滞。

API使用和B2D市场分析

国外市场：

根据巴克莱的研究报告，谷歌的月度推理量已经飙升至480万亿Token，短短一年内增长了50倍，这可真是个惊人的数字！

在AI推理流量方面，谷歌几乎是独占鳌头。2025年第一季度，谷歌处理的AI推理Tokens总量达到了约634万亿，而微软的同期处理量仅有100万亿。增长的势头也非常惊人：到2025年4月，谷歌的月度推理量已经达到480万亿，和一年前的9.7万亿相比，简直是翻了50倍！这意味着谷歌目前的AI推理规模大约是微软Azure和ChatGPT加起来的六倍。

更让人意外的是，谷歌在成本控制方面的能力也很强。巴克莱估算，按照Gemini 2.5的费率，2025年第一季度的推理成本约为7.5亿美元，仅占搜索收入的1%。即使Token以四倍的速度继续上涨，成本占比依然远低于搜索核心基础设施成本的18%。

国内市场：

根据Xsignal的数据，国内前八大公司的总调用量约为138万亿，仅为谷歌的1/3.5。由于Deepseek和豆包的调用主要集中在App端，所以很多都是免费的无收益调用。

数据

AI编程API的使用情况

说实话，A社和谷歌这两个巨头几乎把这块市场吃得干干净净了，真可惜，连Deepseek和其他中国选手都没能在总量市场上露面。

AI编程的收费模式相对比较实在，用户粘性强，也可能有较高的付费意愿（这点还需观察），毕竟经济实力也比较雄厚（也许吧）。

最新消息：Sam开始有新动向了……

来源：知乎

原文标题：我国是否跟上了此次 AI 革命？ – 小七的回答

原文链接：https://www.zhihu.com/question/648487085/answer/1977654587218486934

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！