
作者|参商 西梅汁
编辑|星奈
媒体|AI大模型工场

国内大模型发展趋势|12月份解读
C端流量争夺战与“超级APP”雏形显现,AI原生应用迎来商业化爆发
最近,国内的AI大模型行业正在经历一个重大的转折点,C端流量的争夺变得异常激烈,商业化的路径也逐渐清晰。各大科技巨头不再仅仅满足于服务B端,而是纷纷整合资源,开始全力进攻C端市场。
这种转变的背后,正是“AI原生超级APP”雏形的迅速浮现。例如,阿里巴巴成立了千问C端事业群,把夸克、UC等重要产品整合在一起,通过统一的AI底层技术为用户提供多场景的服务。而千问App在公测仅23天内,月活跃用户就突破了3000万,增速甚至超过了ChatGPT,成为全球增长最快的AI应用之一,这说明了打造超级入口的巨大潜力。
如今,C端流量的激增已经成为行业的关键词,用户增长数据不断刷新历史纪录。字节跳动的豆包大模型日均Token使用量突破了50万亿,而海外的AI助手Dola日活跃用户也破千万,双线领跑国内外市场;商汤的Kapi相机凭借AI拍照的核心优势,用户数量迅速上升,曾一度登顶苹果App Store中国区“摄影与录像”类应用的榜首;腾讯的混元2.0在发布三天内就达到了1.2亿次的调用量,亲民的定价策略也进一步加速了市场的渗透,流量争夺已经进入了白热化的阶段。
更有趣的是,C端市场不再是单纯的“烧钱换规模”,而是逐步展现出真实的商业化弹性。月之暗面完成了5亿美元的C轮融资,估值达到了43亿美元,同时Kimi的付费用户月增速也达到了170%,海外API收入更是增长了4倍。与早期“先扩大DAU再谈变现”的互联网逻辑不同,大模型产品已经进入了“用户愿意为能力付费”的新阶段,这对行业的信心来说,意义甚至不亚于一轮大融资。
巨头与创业公司同频共振,一方面通过超级入口整合场景、争夺用户,另一方面通过真实的付费来验证产品的实力,从而推动行业从“烧钱叙事”向“盈利叙事”转变。我们相信,一个更加注重用户体验、商业健康与生态协同的AI原生时代,正加速向我们走来。
2025年末大模型 “吸金” 超百亿,商业化终于 “造血” 了?
在12月,国内AI大模型行业的资本动作频繁,融资和IPO双双涌现,成为年末行业的焦点。月之暗面完成了5亿美元的C轮超募,阿里、腾讯等老股东也纷纷加码,投后估值达到43亿美元;智谱则在冲刺港股IPO,其他企业的融资动态也相继涌现,赛道年末的“吸金”总额超过了百亿。
这股资本热潮的背后,主要是商业化“造血”能力的初步实现。月之暗面的Kimi付费用户月增速达到170%,海外API收入增长4倍,证明了付费模式的可行性;智谱的招股书显示,2022-2024年的营收年复合增长率达到130%,本地化部署收入占比超过80%,MaaS模式也逐渐形成规模化变现。这些数据打破了“大模型只烧钱不造血”的质疑,让资本看到技术到盈利的清晰闭环。
各企业的资本路径也显现出不同的特征。月之暗面选择“短期不上市”,通过技术突破和增长数据在一级市场募得巨额资金,专注于下一代模型的研发;而智谱则通过IPO来打通长期融资渠道,持续应对算力和研发的投入。同时,政策层面科创板、港交所相关通道的优化,也为尚未盈利的硬科技企业上市提供了便利,进一步助推了资本化的进程。
到2025年底,百亿资本的聚集,或意味着大模型行业已跨越技术爆发与市场启蒙的初期阶段,进入一个以商业化实绩为导向、差异化竞争为特征的中场竞争。关键在于,能否在资本的助力下,真正构建出稳固的盈利模型和生态价值,这将主导下一阶段的行业分化。大模型的“造血”故事,才刚刚开始。
多家企业扎堆敲钟!国产 AI 芯片迎来史上最密集 IPO 期
最近,国产AI芯片行业迎来了前所未有的密集IPO潮,多家领先企业陆续进入资本市场。
摩尔线程与沐曦股份已经在2025年12月成功上市,上市首日股价均大幅上涨。壁仞科技也成功在港交所上市,成为“港股国产GPU第一股”。紧接着,天数智芯也将于2026年1月8日在港交所挂牌。此外,燧原科技已经完成科创板IPO辅导,百度旗下的昆仑芯也启动了赴港IPO进程,这显示出市场对这些企业的极高关注度与资本热情。
这股上市热潮的背后,源于多重强劲驱动因素的共振。首先,国内大模型应用的爆发式增长带来了巨大的算力需求。其次,在复杂的国际形势下,供应链安全与自主可控成为首要任务,为国产AI芯片提供了明确的替代空间和广阔的市场机会。最后,资本市场特别是科创板为具备核心技术但尚未盈利的硬科技企业提供了上市通道,打通了研发投入与资本退出的循环。
当然,成功上市只是进入新阶段的入场券,行业竞争的核心正在深化和转移。竞争的焦点不仅是单一的芯片算力参数比拼,而是转向涵盖芯片、系统、软件的整体计算效能与性价比的较量。
市场分化加剧,谁能胜出?
其实,市场正在变得越来越分化。在高端训练芯片领域,门槛相当高,而推理芯片则因为能更好地应用于实际场景,被认为是国产芯片实现大规模应用和独特竞争的关键所在。对所有公司来说,真正的“交付考验”才刚刚开始,实际产品的落地能力、稳定的客户订单以及清晰的盈利路线,将成为衡量企业价值的新标准。
国内大模型的最新动态字节跳动
到2025年底,字节跳动的海外AI助手Dola的日活跃用户数突破了千万,火山引擎被选为2026年春晚的独家AI云合作伙伴。同时,豆包大模型1.8版本和Seedance 1.5 Pro音视频创作模型也相继推出,豆包手机助手的技术预览版及nubia M153工程样机的发布,引发了商业生态的热烈讨论。
12月31日,字节跳动的海外AI助手Dola迎来了日活跃用户数突破千万的大喜讯。这个产品专注于对话问答、写作翻译和图像处理,定位为“写作、思考与创作的一站式助手”。数据显示,自10月以来,Dola在印尼、马来西亚和墨西哥等国的Google Play上下载量排名前20名,在墨西哥一度连续一周成为单日下载冠军。Dola的前身是2023年8月推出的Cici,并在2025年底更名。
在12月28日的活动中,中央广播电视总台宣布火山引擎成为2026年春晚的独家AI云合作伙伴。火山引擎将运用前沿的多模态大模型和云计算技术,积极参与春晚的节目、线上互动和视频直播,为这个全球华人团圆盛宴增添科技色彩。
在12月18日的火山引擎FORCE原动力大会上,总裁谭待分享了重要数据:豆包大模型的日均token使用量已经突破50万亿,比去年同期增长了超过10倍,截至12月,已经有超过100家企业的token使用量累计超过一万亿。同时,豆包大模型1.8版本也在会上发布,增强了工具调用能力、复杂指令遵循和OS Agent能力,实现了从“高效执行者”到“全能规划师”的跨越。此外,火山引擎还推出了新的AI安全功能MaaS on AICC,支持在AICC加密环境中运行所有模型,用户只需一键即可启动机密推理服务。
12月16日,字节跳动的Seed团队发布了新一代音视频创作模型Seedance 1.5 Pro,支持音视频的联合生成,能够处理从文本到音视频合成、图像引导音视频生成等各种任务。
这个模型实现了三大核心突破:首先是音画同期的精准度,提升了口型、语调和表演节奏的匹配,原生支持多种语言以及四川话、粤语等方言;其次是具备电影级的运镜控制能力,可以执行长镜头跟随、希区柯克变焦等复杂镜头,展现专业的影调和画面衔接;最后是增强了语义理解与叙事协调性,提升了内容叙事的感染力。目前,该模型已经上线即梦AI和豆包App,技术细节也已通过Model Card公开。
12月1日,豆包手机助手正式推出技术预览版,并与中兴通讯共同发布了nubia M153工程样机。这个产品支持用户指令下的跨应用服务,如点外卖、订机票、购物比价、回复微信消息以及操作小程序游戏等。刚推出不久,微信、淘宝、大众点评、拼多多等App便相继禁止在“豆包手机”上使用,这引发了对AI终端商业生态走向的热议。
阿里
12月31日,阿里通义千问团队在魔搭社区和HuggingFace平台上开源了新一代图像生成模型Qwen-Image-2512。这个模型在人物肌肤质感、自然纹理还原及复杂文字渲染等方面实现了显著提升,生成的图片中人物发丝清晰可见,可以流畅生成漫画风格的PPT、数据图等复杂图像,满足专业设计的多样需求,开发者和企业可以免费下载用于商业用途。
12月31日,夸克AI眼镜在首发后进行了首次重大OTA更新,系统版本升级至1.2.1。此次更新新增了录音纪要、图文备忘录、大模型多意图理解执行、蓝环支付和社区服务五大核心功能,同时翻译语种数量从原来的数量猛增至89种,还优化了导航、音乐、行程查询等高频场景的交互体验,进一步提升了产品的实用性和竞争力。
12月29日,阿里通义实验室发布了MAI-UI系列GUI智能体基座模型,该模型原生集成用户交互、MCP工具调用和端云协同能力。通过自主进化的数据管线和大规模在线强化学习,在五个权威评测集上取得了顶尖成绩。其中,MAI-UI-32B模型在AndroidWorld等真实任务基准中创造了当前最优的成绩,同时轻量化的2B和8B版本也同步开源,将降低GUI智能体的开发门槛。
12月25日,阿里通义千问团队开源了Qwen-Image-Edit-2511图像编辑模型,这是该系列模型在2509版本之后的一次重大迭代。新版本重点优化了“图像漂移”问题,在人物一致性保持、工业设计和多模态控制等场景上实现了显著升级,支持多人合照的精准融合,并通过内置LoRA模块实现光照、材质和视角的细致化控制,适应更多专业设计需求。
12月24日,阿里对Qwen3-TTS语音模型家族进行了重要的升级,推出了音色创造模型Qwen3-TTS-VD(VoiceDesign)和音色克隆模型Qwen3-TTS-VC(VoiceClone)。尤其是音色克隆模型,仅需3秒音频即可高保真复刻原声,支持10种语言及方言,词错误率(WER)比主流方案低15%,生成速度达到实时的两倍以上,进一步巩固了阿里在语音合成领域的技术优势。
12月23日,阿里在教育领域的重要布局,千问智学App正式上线,深度整合阿里自研的学习大模型,面向小学、初中、高中及研究生阶段的用户提供免费的1对1学习辅导服务。App内置智能体“小千老师”,涵盖知识点讲解、习题答疑和作业批改等核心功能,所有服务完全免费,没有强制订阅或隐藏收费,旨在通过AI技术普惠优质教育资源。
12月22日,阿里正式发布Qwen-Image-Layered模型,这是AI领域首次实现PS级图层编辑能力的模型。通过自研架构,模型可以将图片精准拆解为独立图层,支持局部修改、对象替换和色彩调整等精细操作,彻底解决了传统AI生图“牵一发而动全身”的行业痛点,被业内视为AI图像编辑领域的里程碑式突破。
12月22日,千问官方发布了“2025十大AI提示词”榜单,基于平台海量用户交互数据,精准揭示了中国用户使用大模型的真实高频场景。榜单中,排名依次为:股票、八字、情感咨询、职场、学习、健康、育儿、旅游、美食和人生意义,这反映出AI已经深度融入用户的工作、生活与精神需求场景。
12月20日,阿里通义千问团队在Hugging Face、Model Scope等平台正式开源了Qwen-Image-Layered模型。这个模型具备突破性的图像分层编辑能力,可以将图像分离为多个独立编辑的RGBA图层,用户可以通过提示词指定3到10个图层数量,并对分解出的任何图层进行无限递归分解。模型基于包含1000多款游戏和500万张专业设计图的海量数据集进行训练,为图像设计和创意创作提供全新工具。
12月18日,千问App正式接入了高德地图的核心服务,完成了从纯对话交互到场景化服务的重大升级,具备了对物理世界的理解与行动能力。用户可以基于实时地理信息,通过千问生成包含餐厅推荐、酒店信息和路线规划的可视化决策卡片,并直接调用高德的导航服务,实现“查询-决策-执行”的全链路闭环。
此外,依托阿里AI空间的智能感知技术,高德地图上线了“AI停车雷达”功能,可以实现分钟级车位预测。目前,这一功能已经在北京率先覆盖了数万个道路停车位,有效解决了用户“找车位难”的问题,提高了出行效率。
12月16日,阿里发布了通义万相2.6系列模型,涵盖文生视频、图生视频、图像生成等五大核心能力,成为国内首个、全球第二个支持角色扮演功能的视频生成工具(继OpenAI Sora 2之后)。这个模型支持音画同步、多镜头生成、声音驱动和分镜控制等专业功能,单次可以生成15秒的影视级视频,将用户简单的提示词转换为多分镜脚本,确保多镜头间主体与场景的一致性,满足专业影视制作的需求。模型同时上线于阿里云百炼与万相官网,向企业和开发者开放服务。
12月15日,阿里通义百聆正式发布并开源了Fun-CosyVoice3-0.5B语音合成模型,核心突破在于零样本音色克隆技术——仅需3秒参考音频即可高保真复刻任意人声。模型支持9种语言、18种方言及多种情感表达,允许本地部署与二次开发,为播客制作、有声书创作、智能客服等场景提供灵活的语音解决方案。
与此同时,阿里还开源了轻量化语音识别模型Fun-ASR-Nano(0.8B参数)。该模型在噪声环境中的识别准确率处于行业领先水平,支持31种语言的自由混说及歌词说唱识别,能够高效适应本地部署需求,进一步完善了通义百聆的语音技术生态。
阿里、钉钉、腾讯、百度与科大讯飞的最新动态
在12月11日,阿里推出了Qwen3-TTS语音合成模型,它能随意切换49种音色,支持10种语言和方言,让人耳目一新。这个模型的词错误率和拟人化水平在行业中都是佼佼者哦!而且它特别适合用在播客和有声书的场景中,可以精准地还原不同角色的声音,真是给内容创作者提供了个超级实用的工具。
紧接着,12月10日,千问App在公测短短23天内,月活跃用户数就突破了3000万,真是个成长神话,成为全球增长最快的AI应用之一!他们还推出了AI PPT、AI写作、AI文库和AI讲题四个新功能,让办公和学习变得更方便,进一步强化了“会聊天、能办事”的产品形象。
再说到12月9日,阿里巴巴进行了一次重大的组织调整,成立了千问C端事业群,由副总裁吴嘉负责。这次变革融合了原来的智能信息和智能互联事业群,涵盖了千问APP、夸克浏览器、AI硬件等核心产品,目标是把千问打造成AI时代的“超级APP”,覆盖购物、旅行、办公等各个生活场景,与此同时,也是阿里推进“用户至上,AI驱动”双轮驱动战略的重要一步,标志着他们将AI技术从产业领域推向消费端。
而在12月2日,千问App接入了通义万相2.5模型,视频生成能力得到了重大提升。这款模型是业内少数能够做到音画同步的视频模型之一,支持文本、图像、视频和音频的多模态输入输出,用户只需提供一张照片和一段文字,就能生成1080P高清唱跳视频,最长可达10秒,还能精准匹配口型,保证动作自然。升级后,千问App在公测一周内下载量就突破了1000万,超越了ChatGPT等产品,成为历史上增长最快的AI应用,日活跃增速是行业平均的5倍,迅速跻身App Store工具类榜单的前三。
整个12月,阿里在AI方面的动作真是密集又频繁。他们不仅成立了千问C端事业群,月活跃用户数也突破了3000万,还接入了高德来拓展场景。发布了多款多模态模型并开源,覆盖了图像和文本等领域,电商、教育和办公等多个场景的AI渗透率都在不断提高,推动着AI的原生转型。
钉钉的全新AI操作系统
到了12月23日,钉钉在杭州举行了AI钉钉1.1新品发布暨生态大会,推出了全球首个为AI打造的工作智能操作系统——Agent OS,从此钉钉告别了传统的移动互联网应用形态,向AI操作系统转型,未来所有的AI Agent都将在这个系统上运行。
同时,钉钉还发布了20多款AI新品,包括企业级AI硬件DingTalk Real和制造业的“订单Agent”“质量Agent”等商业可交付的Agent。“订单Agent”能一键把订单图片转成排产表,而“质量Agent”则能够预测故障并推送智能检修提醒,从而帮助企业将订单处理时间缩短75%,降低错误率80%。另外,DingTalk A1硬件模型也在不断迭代中,已与客户完成了两千多次共创,进一步增强了语音转写和语义分析等能力。
腾讯的AI创新与突破
12月30日,腾讯混元发布并开源了翻译模型1.5版本,提供了1.8B和7B两种尺寸,支持33个语种互译及5种方言,覆盖了主流语言和小语种,特别适合手机端的离线实时翻译。值得一提的是,1.8B模型只需1GB内存就能流畅运行,推理速度也很快,达到0.18秒处理50个tokens,还支持术语库自定义和长文本理解等功能,已经接入了腾讯会议和企业微信等内部场景,开发者可以通过GitHub等平台下载使用。
12月17日,腾讯AI实验室在计算机视觉领域也取得了重大突破,推出了AdaptVision智能视觉系统。这个系统独创了分层视觉策略,先用低分辨率图像把整体情况掌握,再精确分析关键区域,同时通过解耦回合策略解决传统训练中的“功劳归属问题”。实测结果显示,在保持相同准确率的情况下,平均仅使用传统方法33%的视觉信息量,识别摩托车号牌时甚至可以节省70%的计算资源。
同样在12月,腾讯混元世界模型1.5也正式发布,成为国内首个开放实时体验的世界模型产品,其相关功能也已上线腾讯云开发者平台,为开发者提供空间智能仿真的能力支持。
再往前看,12月5日,腾讯发布了自研的大模型混元2.0,推出了Think与Instruct双版本。这款模型采用了混合专家架构,总参数高达406B,激活参数32B,在核心能力上取得了显著突破:在2025年国际数学奥林匹克(IMO)的公开题中准确率达83.1%,超越了GPT-4o,处理10万字长文档的响应时间缩短至12秒,代码生成任务的MultiPL-E测试得分为59.2,支持12种编程语言的全流程开发。
而在定价方面,以0.8元/百万Token的输入和2元/百万Token的输出的亲民价格重新定义了行业的性价比,发布三天内调用量就突破了1.2亿次,已有1.8万家企业申请接入腾讯云API。目前模型已通过元宝APP、腾讯云API等多渠道开放,实现了腾讯系产品的全覆盖,应用于金融、医疗、教育等多个领域。
百度的最新发布与动态
转到百度,1月1日,旗下的AI芯片子公司昆仑芯以保密方式向港交所提交了主板上市申请,分拆后百度仍持有59.45%的股份。高盛预测,若按40倍市销率计算,百度的持股价值可能达到220亿美元,占其当前市值的45%。
在12月31日,百度文心APP升级了“放心写”功能,专注于公文和教育教学两大中文写作场景,基于权威数据源实现一键生成高质量公文,AI可进行事实提取、自动校验和修正,文章准确率超过99%。这个功能还支持上传文档作为创作参考,借鉴内容会高亮展示,使用起来非常灵活方便。
同一天,百度还宣布开源了文心大模型4.5系列的10款模型,包括47B、3B激活参数的混合专家模型和0.3B参数的稠密型模型,完全开源了预训练权重和推理代码。
12月25日,百度举办了AI Day活动,公布了超级智能体百度伐谋的最新进展,并发布了“同舟生态伙伴计划”。自11月发布以来,百度伐谋已与2000多家企业进行场景共创,此次升级进一步提升了其通用性和生产级能力。“同舟生态伙伴计划”面向高校实验室和行业软件企业开放核心能力,提供高质量的场景、课题及免费支持,加速AI技术的落地。在现场,他们还展示了在汽车研发、气体分离构型设计和防灾减灾预警等场景的应用成果。
此外,12月23日,文心大模型5.0-Preview在LMArena大模型竞技场的最新文本榜上以1451分名列中国第一,超越了Claude-Opus-4-1、GPT-5.2等多款国内外主流模型,在创意写作和高难度指令等方面展现了突出优势。用户可以在文心APP的最新版本中抢先体验该版本。
12月16日,百度在秒哒2025创造者大会上发布了无代码应用搭建平台“秒哒”的最新进展。上线8个月以来,累计生成了超过50万个商业应用,每日新增应用涨幅超过150%,其中一半带有后端,覆盖了教育、商业等200多个场景,累计创造了超过50亿元的经济与效率价值。在现场,他们还发布了“创造者筑梦计划”,未来三年将通过流量扶持和交易分成等方式帮助100万名创造者实现收入,2026年还将筛选出15个高商用潜力项目开通快速通道,个人开发者项目有望获得百万元以上的投资。
科大讯飞的优秀表现
最后,1月5日,第三方机构根据公开数据统计,科大讯飞在通用大模型厂商中以210个中标项目和231568万元的披露金额,双双排名第一,继2024年后继续蝉联大模型的“标王”。这些中标项目主要分布在教育、医疗、金融、通信、能源和政务等行业,其中80%以上都是应用类项目。
在12月12日,科大讯飞发布了讯飞星火X1.5深度推理大模型,整体性能达到GPT-5的95%以上,采用了全栈自主可控技术架构,在华为昇腾芯片上完成了训练,将MoE模型的训练效率从30%提升至93%,实现了全国产算力的支持。
同时,科大讯飞的智能体平台Astron也全面开源,这个平台将AI“大脑”和RPA“手脚”结合,为开发者提供了即插即用的行业解决方案,进一步完善了AI生态布局。
科大讯飞的两大AI新应用:引领未来
最近,科大讯飞的两项AI应用案例获得了行业的认可。其中一个是他们的AIUI人机交互平台,这个平台可真是牛,结合了多种感知技术,连接了20万的生态伙伴和22.5亿的终端设备,日均交互次数超过3亿次!而且,预计到2025年,它还将加入大模型技术,增加更多轮次的对话和长时记忆功能。另一个案例是四川西充县的智能化应急管理体系,通过整合多种数据,能够实现风险预警、违规识别和资源快速调配,真的是解决了县域安全治理的一个难题。
智谱的崭露头角
智谱(02513.HK)的发行价为每股116.2港元,成功在港交所上市,成为全球大模型的第一股。上市首日,开盘价为120港元,尽管一度跌破发行价,但午盘后迅速反弹,最终以131.5港元收盘,涨幅达到13.17%,市值也达到了578.9亿港元。上市后的表现非常抢眼,股价一度飙升超过60%,创下新高,甚至曾经触及208.4港元,市值突破1100亿港元。期间,他们还宣布与滴滴达成战略合作,专注于出行领域的AGI应用,同时中标了中科院高能所的科研项目,金额达到640.28万元,预告了下一代模型GLM-5的上线。整体来看,智谱的表现非常稳定,市场关注度也非常高,香港公开发售超额认购达到了1159.46倍。
12月30日,智谱正式启动招股,认购期将持续到2026年1月5日,计划于1月8日在港交所主板上市,股票代码是“2513”。根据招股书,智谱此次IPO计划发行37,419,500股H股,其中香港公开发售1,871,000股,国际发售35,548,500股。按照每股116.2港元的发行价计算,预计募资规模将达到约43亿港元,市值有望超过511亿港元。
12月28日,全球权威的AI模型评测榜单Artificial Analysis发布了最新的“AA智能指数”榜单,智谱的GLM-4.7模型以68分的综合成绩荣登开源模型的榜首。这个榜单主要评估模型的知识储备、逻辑推理、代码生成等核心维度,被业界视为模型综合实力的重要标志。而GLM-4.7之前已经在开源社区Hugging Face的全球趋势榜上名列前茅。
12月23日,智谱发布了GLM-4.7编程大模型,相比于前代的GLM-4.6,在编码能力、交互体验和复杂推理方面都有了系统性的提升。在多个基准测试中,该模型的得分超过了GPT-5.1,SWE-Bench的得分达到了73.8%,创下了开源新高。模型在复杂推理、核心编码等能力上显著增强,支持“先思考,再行动”的模式,官网的Chatbot和API也已同步上线。
12月10日,智谱发布并开源了GLM-ASR系列语音识别模型,同时推出了基于该系列模型的桌面端智谱AI输入法,进一步拓展了语音技术的应用场景。
12月9日,智谱宣布开源了核心AI Agent模型AutoGLM,这可是全球首个具备“手机操作”能力的AI Agent哦!它能稳定完成外卖点单、机票预订等长达数十步的复杂操作,能够“看懂”屏幕,并模拟人类进行点击和输入操作,支持超过50个高频中文应用场景。这一开源将大大降低AI手机技术的门槛,推动AI手机生态的开放和共创,同时保障用户的数据与隐私控制权。
12月8日,智谱上线并开源了GLM-4.6V系列多模态大模型,进一步完善了多模态技术生态,给开发者提供了更丰富的多模态处理能力。
MiniMax的精彩表现
MiniMax(0100.HK)以165港元/股的价格在港交所上市,表现非常火爆,开盘后迅速上涨,盘中一度涨幅超过80%,最终以345港元收盘,涨幅达到109.09%,市值突破1000亿港元。上市后的第二天,股价又上涨了15.36%,市值达到了1231亿港元,后来盘中涨近40%,最高达398港元/股,上市以来累计涨幅超过141%。公司还成功行使了超额配股权,按发行价发行了437.96万股,额外募资约7亿港元,累计募资总额达到了55.4亿港元。上市前的香港公开发售超额认购达1837.17倍,参与认购人数超过42万,国际发售的超额认购也达到了36.76倍,引入了阿里、易方达等14家基石投资者,市场热度可谓空前。
12月29日,MiniMax的M2.1模型全面上线AtomGit平台,开发者可以在这个平台上下载并体验。此外,官方还披露了该模型在Agent/工具脚手架泛化能力上的优势,在多款编程工具和Agent框架中表现稳定,支持多种Context Management机制,并提供了M2.1和M2.1-lightning两个版本的API。
12月26日,MiniMax正式开源了MiniMax M2.1模型,开源权重可通过Hugging Face、GitHub等平台下载,支持SGLang、vLLM等多种推理框架,并提供了最优参数配置。这个模型采用了MoE架构,参数量达到229B,激活参数量为10B,相比前代M2在编程相关场景的核心榜单得分最高提升了60%,多语言表现也超越了Claude Sonnet 4.5和Gemini 3 Pro。
此外,MiniMax还与快看漫画达成了合作,作为核心技术合作伙伴,为快看漫画正式发布的AI陪伴互动漫画提供视频生成和语音生成模型支持,实现了AI技术与漫画世界观、角色互动的深度结合。
12月22日,MiniMax正式发布了全栈编程大模型MiniMax M2.1,该模型打破了AI编码的“偏科”局限,实现了后端、APP、3D开发的全栈顶尖水平。在全新的VIBE综合榜单中以88.6分展现了接近Claude Opus 4.5的全栈构建能力,在SWE-bench Multilingual榜单中以72.5分展现了强劲竞争力。模型系统性提升了Rust、Java、Golang等多种编程语言的能力,显著增强了原生Android/iOS开发能力,支持复杂3D场景模拟和高质量可视化表达,思维链更精炼,响应速度提升且Token消耗下降,同时对主流编程工具进行了专项优化。
商汤科技的飞速发展
12月20日,商汤的Kapi相机用户量突破了千万,成为了千万用户的首选摄影APP。这个产品是行业首个“AI拍照助手”,能够复刻Apple Log曲线,实现电影级质感直出,内置40多款复古滤镜,1-2秒内智能识别场景并推荐最优滤镜和构图建议,之前已在菲律宾App Store免费应用总榜登顶,并进军英国、法国等多个欧洲国家的榜单前五。
12月19日,商汤科技发布了咔皮记账APP的全新升级版本,成为年轻人的“新一代AI财务助手”,具备秒记账、会省钱、懂规划的三大核心功能,依托日日新多模态大模型支持日常消费记账等场景。
12月18日,商汤科技旗下的大晓机器人发布了三大核心技术突破:ACE具身研发范式、开悟世界模型3.0(首个面向商业应用的开源世界模型)、A1具身超级大脑模组,进一步推动了具身智能商业化的落地。开悟3.0已经与沐曦股份、壁仞科技、中科曙光等多款国产芯片完成了适配。
同时,商汤科技、大晓机器人与中科曙光达成了战略合作,三方将共同打造具身智能领域的全栈国产化能力,构建“算力基础设施+模型-具身融合”的生态,抢占“多模态-具身”融合升级的赛道。
12月17日,商汤发布了如影营销智能体,打造了新一代的电商AI增长引擎。这个产品通过店铺运营、直播运营、流量投放、直播场控四大电商Agent以及数字人组成的“五大智能体矩阵”,提升了运营效率,其中直播数据复盘效率提升了6倍,数字人可以实现“当日复刻当日播”,助力电商场景的智能化营销升级。
12月16日,商汤科技正式发布了AI办公智能体“小浣熊3.0”,实现了三大核心跃迁:从生成“草稿”到交付“成果”,能够一键生成包含大纲、版式、插图和数据图表的专业PPT,支持云端+本地多元素快速编辑;从响应“指令”到理解“任务”,具备长链条思考能力,支持百万级数据的秒级处理和多源关联分析;从“单点”工具到融入“工作流”,支持跨平台处理且移动端上线,企业级场景落地的精度超过95%。该产品依托日日新大模型在Agentic RL领域的突破,具备类人记忆与自主校验纠错能力,已服务1500万+个人用户与数千家企业用户,并向浙江大学图书馆捐赠教育版。
12月15日,商汤日日新Seko系列模型与寒武纪成功适配,实现了国产算力与多模态AI技术的关键跨越,为国产化AI生态的算力与模型协同优化提供了支撑。同时,基于该系列模型的多剧集生成智能体Seko2.0也亮相商汤产品发布周,具备创编一体、多剧集生成的能力。
AI领域的新动向,快手和蚂蚁集团的最新发力
最近,商汤科技的“产品发布周”完美落幕,他们推出了好几款AI产品,像是Seko 2.0、小浣熊3.0和如影营销智能体等,市场反响非常不错哦!这些产品都是基于他们的新一代多模态大模型开发的。
12月3日,快手的可灵AI也有大动作,推出了视频生成2.6模型。这个新模型的“音画同出”能力,彻底颠覆了传统的AI视频制作流程,以前是先有画面再加配音,现在可以同步生成,省时又省力。
这个模型支持两种功能:根据文字生成音画和根据图片生成音画。它可以一次性生成包含自然语言、动作音效和环境音的完整视频,音画配合得相当好,音质也非常棒,中文语音的生成效果在全球都是顶尖的。此外,它还支持中英文语音生成,最长的视频可以达到10秒。快手还透露,可灵AI的2025年收入预期将达到10亿元人民币,比年初设定的目标提升了超过100%呢。
而在12月2日,快手的可灵AI团队宣布了一个重磅消息——全球首个统一多模态视频模型——可灵视频O1模型全面上线了。
据说,O1模型是基于最新的视频和图像技术,利用自然语言作为语义基础,同时结合视频、图片和主体等多种描述,把所有生成和编辑任务都整合到一个强大的引擎里。
接着,在12月15日,蚂蚁集团也有了新的进展,他们把旗下的AI健康应用AQ品牌升级为“蚂蚁阿福”。这次升级不仅是品牌的焕新,更是功能的全面提升,代表着他们在数字健康领域的战略重心从“医疗AI工具”转向了“AI健康朋友”的系统化转变。
新版的App聚焦于“健康+”战略,增加了“健康陪伴、健康问答、健康服务”三个主要功能。用户可以接入九大品牌的智能设备数据,整合线下的健康记录,还能为家庭成员建立健康档案;“AI诊室”功能支持多种交互方式,通过图片识别50种常见皮肤病,解析99%的常见检查报告,准确率超过95%;还可以链接全国30万的真人医生和500多位名医,为用户提供在线问诊和挂号购药等一站式服务。
官方数据显示,这款App的月活跃用户已经突破1500万,跻身国内AI应用的前五名,55%的用户来自于三线及以下城市,日均处理的健康咨询问题超过500万次。
12月9日,通用AI助手灵光也推出了网页版,进一步完善了它的多端生态。用户现在可以直接通过浏览器访问,享受电脑端的“灵光对话”和“灵光闪应用”功能。这个网页版保留了“30秒用自然语言生成小应用”的核心优势,实现了移动端与电脑数据和创作的同步。用户在电脑上描述需求,就能快速生成、编辑和管理对话与闪应用,并在手机上继续使用和分享。
而在12月2日,灵光的App上线仅两周,就让用户成功创建了330万个“闪应用”,覆盖了互动游戏、情绪管理、健身计划等多个场景。数据显示,灵光上线6天内就突破了200万次下载,远超ChatGPT首周的60.6万和Claude的15.7万。
再说说12月31日,月之暗面的创始人杨植麟发布了内部信,宣布公司完成了5亿美元的C轮融资,而且超募不少。IDG资本领投了1.5亿美元,还有阿里、腾讯、美团的联合创始人王慧文等老股东也参与了超额认购,投后估值达到了43亿美元。
信中提到,目前公司手头的现金超过100亿元人民币,短期内不急于上市,计划将这些资金用于扩展显卡、研发K3模型以及提高员工激励。杨植麟制定了2026年的三大战略:专注于K3模型的研发、加快商业化进程、提升员工激励。
数据显示,在2025年9到11月间,Kimi的全球付费用户平均月增速达到了170%,K2 Thinking的发布更是让海外API收入增长了4倍,成为公司商业化增长的核心动力。
在12月28日,月之暗面在Hugging Face上发布了Kimi K2 Thinking模型的开源权重,采用了修改版的MIT许可证,赋予了完整的商业和衍生权利。开发者、研究人员和公司都可以自由使用、修改和分发这个模型,进一步推动AI智能体技术的开放生态。
此外,蓝耘科技和月之暗面达成了合作,通过蓝耘的MaaS平台部署Kimi K2模型,为开发者提供高效、低成本的AI编程解决方案,实现本地化部署和免翻墙使用,效果与Claude Code相近。
12月18日,微软与月之暗面就Agent级技术展开了深入洽谈,计划上线基于Kimi模型的智能体功能,以推动Microsoft 365办公套件向全面自动化迈进。这次合作主要是针对Office产品的智能化改造,利用Kimi强大的思考能力和工具调用能力来提升办公效率。
最后,12月8日,月之暗面的联合创始人张予彤被正式任命为Kimi的总裁,全面负责公司的战略与商业化,包括融资和市场拓展等关键工作。这一人事变动标志着公司从技术驱动转向技术与商业双轮驱动,加速推进Kimi模型的商业化落地。
12月31日,DeepSeek团队发布了一篇新论文,提出了一种新的残差连接方案,旨在稳定训练并提升大模型的可扩展性。
这篇论文由创始人梁文锋参与撰写,介绍了一个叫“流形约束超连接”(mHC)的框架。作者表示,这个框架旨在提升可扩展性,同时降低训练先进人工智能系统所需的算力和能源消耗。值得关注的是,DeepSeek的下一代旗舰系统R2预计将在春节前后推出。
12月1日,DeepSeek正式发布了两款核心大模型的正式版:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。DeepSeek-V3.2增强了Agent能力,平衡了推理能力与输出长度,适用于日常问答和通用Agent任务场景,在公开的推理Benchmark测试中达到了GPT-5的水平,接近Gemini-3.0-Pro,并且输出长度相比Kimi-K2-Thinking大幅减少,显著降低了计算开销和等待时间;而DeepSeek-V3.2-Speciale则是长思考增强版,融合了DeepSeek-Math-V2的定理证明能力,具备优秀的指令跟随、严谨的数学证明和逻辑验证能力,其推理基准性能与Gemini-3.0-Pro相媲美。










能否分享一些成功案例,帮助更多创业公司找到合适的商业模式?
Kimi的用户增长率真是令人惊叹,难道大家都对付费模式这么买账?
Kimi付费用户增速170%,是不是意味着用户对AI应用的价值认同在提高?
看到Kimi的成功模式,我想知道其他创业者是否也能从中找到灵感?
建议关注AI应用的用户反馈,毕竟用户体验是商业化成功的关键。
从文章看,行业正在向盈利转变,期待更多企业能有效利用这个趋势。
随着C端流量增大,建议创业者在产品中融入用户反馈机制,这样更能提升用户满意度。