智谱刘德兵:以极致技术与广泛生态构筑AI护城河

开篇话

当今,人工智能的浪潮正席卷全球,而北京则以其科技创新的力量,成为AI大模型领域的战略堡垒。从智源推出“悟道”大模型,到“天使投资人”模式助力原创项目的孵化,再到智谱、月之暗面等人工智能独角兽的崛起,这座城市不仅汇聚着尖端技术,也在开放的生态系统中孕育着突破性的成果。

目前,北京正在全力打造“全球开源之都”,许多研发机构和企业都在积极拥抱开源,开源概念甚至渗透到了汽车和机器人等多个行业。发展AI就像是一场科技的长征,在北京市科委和中关村管委会的支持下,新京报AI研究院推出了“AI浪潮录”系列专栏,深入访谈参与此次AI浪潮的亲历者和见证者,讲述AI竞争的新格局和背后的故事。

智谱刘德兵:以极致技术与广泛生态构筑AI护城河

智谱董事长刘德兵 受访者供图

到了2025年,AI大模型行业经历了一场翻天覆地的变革,DeepSeek的崛起标志着中国企业的大模型在国际舞台上越来越有影响力:像Qwen、GLM、Kimi等名字频繁出现在国际大模型平台上,许多国产大模型以开源、强大的能力和高性价比赢得了广泛赞誉。

国内的情况也在悄然改变,经历了早期的“百模大战”,AI大模型行业的格局发生了转变:随着开源模型的增多以及智能体能力的提升,越来越多的初创企业开始专注于应用领域。曾经的“AI六小龙”如今只剩下智谱、月之暗面、MiniMax和阶跃星辰四家,被称为“AI四小强”。

在11月5日,新京报AI研究院对智谱董事长刘德兵进行了专访。作为北京AI领域的代表企业,智谱在2019年成立之初就锁定了“让机器像人一样思考”的认知智能方向,并一以贯之。刘德兵带领的智谱团队,成为了国内大模型浪潮中坚定的“种树人”,他们自主研发的GLM系列模型不仅是国内开源的标杆,更被国际顶级科技公司和编程工具广泛应用,证明了中国大模型技术在全球的竞争力。

刘德兵认为,中国的AI正从“跟跑”迈向“并跑”,行业也从“模型热”进入“应用热”和“价值验证”的阶段。他强调,只有更极致的技术追求和更广泛的生态连接,才能建立起面向未来的真正护城河。在面对AGI这个宏伟愿景时,他既有长跑的耐心,也展现出突破关键技术的决心,“智谱会继续专注于基础模型的研发,保持世界级的领先水平。在商业发展上,面对繁荣的市场,我们更要沉下心来,助力客户和伙伴成功实现大模型应用。”

国外AI工具说“中国话”的背后:开源策略双赢

新京报:最近,我们看到美国科技公司使用中国大模型的趋势不断上升,像顶尖的AI编程工具Cursor被发现“频繁说中文”,其基座模型似乎来自中国,而另一款编程工具Windsurf在回应用户询问时,直接承认其模型由中国的“智谱AI”提供,你对此怎么看?

刘德兵:Windsurf采用智谱模型并不是个例。越来越多的海外科技公司开始选择中国的大模型。比如,估值达到93亿美元的美国云平台Vercel已经宣布将智谱的GLM-4.6纳入其官方API服务,全球最大的AI推理芯片公司Cerebras也决定将智谱的GLM-4.6作为其推荐模型。这些都表明,以GLM-4.6为代表的中国大模型已经成为海外顶尖生产力工具的核心,引领着中国大模型的全球竞争力,尤其是在科技编程领域。目前,GLM-4.6在公开评测中的表现已经可以与国际顶尖模型相媲美。

中国的大模型一直以来都坚持开源策略,通过这一方式赢得了全球开发者的认可,极大促进了技术社区的繁荣与技术的快速迭代。目前,我们的开源模型系列在全球的下载量已超过5000万次,凭借高性价比和快速迭代的开源模型,我们赋能了成千上万的开发者,推动了自下而上的创新。

新京报:2025年是智谱的“开源年”,你认为开源是否会影响商业变现,智谱如何在技术开放与商业利益间寻求平衡?

刘德兵:我们认为开源与商业并不冲突,反而是一种双赢的关系。智谱自成立以来就一直支持开源,我们的第一个大模型在2021年发布时就选择了开源。开源能够迅速扩大生态影响力,促进商业模式的成熟,积累生态优势。

同时,闭源模型或基于开源的服务也能转化为实际的商业价值。因此,我们坚持开源和闭源并行的策略。开源为我们带来了大量用户反馈,其优势显而易见,也为我们节省了市场推广成本。我们的GLM-4.6模型开源后,迅速登顶全球多个权威榜单,极大提升了品牌信誉,并直接推动了MaaS平台API的调用量和企业客户的销售增长10倍。这种“开源构建生态,生态滋养商业”的良性循环,成为了智谱在激烈市场竞争中的独特护城河。

除了坚持基础模型的研发,我们还在不断探索智能的极限。更极致的技术和更广泛的生态连接,能够打造成真正的护城河,为新产业价值和突破提供更多可能。

新京报:GLM-4.6推出后,寒武纪和摩尔线程完成了对这个模型的适配。你如何看待国产算力在模型训练和推理中的作用?

刘德兵:实现国产算力的适配是大势所趋,关键在于速度。如果能够合作得当,将能加快这个进程。

目前,我们公司已经适配了40多款国产芯片,包括摩尔线程、寒武纪、昇腾、沐曦等主流国产芯片。国家政策层面也非常支持“国模+国芯”的发展模式。

一个明显的趋势是,算力需求将越来越大,不仅限于训练,还包括推理应用。随着算力规模的持续扩大,我们不可能完全依赖进口,必然会转向国产算力。根据我们目前的适配测试结果,国产算力的表现非常值得期待。事实上,使用国产算力进行训练或推理在技术上已经可行,接下来一两年的重点是进一步提升其表现。

当“AI六小龙”变为“AI四小强”市场更看重模型能否解决实际问题

新京报:如今,中国AI初创企业已经从“AI六小龙”变成了“AI四小强”,你怎么看待这种格局的变化?在这样的环境下,智谱有何计划?

刘德兵:今年,市场已经从最初的“模型热”和注重技术展示,进入了“应用热”和强调价值验证的阶段。

国内AI行业逐渐集中到几家拥有自研能力的公司,专注于基础模型的研发,而其他公司则转向分发和行业应用。这种集中并不是退步,而是说明客户和市场更加看重大模型在具体业务场景中解决实际问题的能力,行业需求也越来越旺盛。

基础模型的竞争愈发激烈,比如在模型参数规模上,正朝着万亿级别迈进,而当前四五千亿参数已经成为基准,模型训练的成本也在不断提高,行业的门槛也随之提升,自然导致了市场的集中。

此外,基础模型若能开源并辐射到多家公司,便减少了其他公司重新研发基础模型的必要性,转而专注于行业应用,这是一个正常的过程。

在这样的变局中,智谱有着自己的战略思考。我们的核心是坚持并深化既定的战略方向:首先,继续做好基础模型,确保与国际领先水平对齐;其次,在商业上,让外部客户能够在我们的开放平台上调用tokens,随着模型能力的提升,模型的调用量也将成倍增长,这也是我们今年更明确的战略方向。在热闹的市场中,我们更要沉下心来,把模型能力转化成客户可感知的生产力价值,这是我们当前最独特的优势。

与此同时,我们也在系统性地考虑拓展海外市场,帮助“一带一路”国家构建自主可控的AI基础设施,依托我们的原始研发能力。同时,我们为海外用户提供API和编码套餐服务,类似于海外的ClaudeCode套餐,这两类服务都是相对标准化的,也是新的增长突破口。

新京报:实现AGI是智谱的愿景,2025年你对此有何新看法?你认为实现AGI的关键里程碑是什么?当前的技术瓶颈和突破方向又是什么?

刘德兵:AGI的未来与初创企业的挑战

刘德兵:自从我们公司成立之初,AGI就一直是我们的目标,目标就是“让机器能像人一样思考”。我们团队的背景来自清华大学的知识工程实验室,拥有近30年的人工智能技术积淀,因此我们对实现AGI充满热情,坚信它终将实现。不过,得说清楚,AGI的实现可不是一蹴而就的,它更像是一场马拉松。

我们把AGI的智能划分为五个等级,逐步推进。第一级是预训练的大模型,第二级是模型对齐,包括多模态和人机对齐;第三级是自我学习,目前大部分大模型厂商都处在这个阶段;第四级是自我认知,而第五级则是意识智能。现在行业正处在关键的第三级,这个阶段虽然已经可以应用,但如何突破到第四级才是更重要的,届时应用将变得更简单,规模也会大大提升,对生活的影响会更加深远,这将是一个巨大的飞跃。

从另一个角度来看,我们认为实现AGI有三个里程碑:第一个是“沉思级”推理落地,模型能够自主分析复杂问题,这几乎已经实现;第二个是L4级智能的规模化和系统化,这是当前面临的主要挑战;第三个是多模态认知的融合,能理解现实世界的因果关系,这个目标还需要时间。

刘德兵:现在像阿里巴巴、字节跳动和百度这样的“大厂”也在大力投资大模型,你怎么看初创企业和这些“大厂”之间的竞争呢?

刘德兵:我们专注于几个核心领域,比如基础模型的研发、特定行业的应用和生态化发展。虽然我们的资源相对较少,但因为专注,能在某些市场进行深度投入。

虽然大厂的资源丰富,但他们的重心可能更偏向于与自身业务相关的领域,他们的AI研发通常是为自己的商业模式服务,所以在原始创新这一块,我们依然有我们的优势。此外,我们团队有优秀的人才,科学家们在制定发展路线时有着长远的视野,这为我们的长期竞争力打下了基础。

认知智能终将到来,AI的价值最终应该体现在民生福祉上

新京报:今年以来,智能体的能力有了显著提升。智谱在智能体方面有哪些变化和进步?你们是怎么应对智能体性能受限的“幻觉”问题的?

刘德兵:智谱在智能体的进化主要体现在两个方面:首先是从“操作”到“思考”。去年我们实现了AutoGLM的手机自动化操作,而今年推出的“沉思”智能体,具备深度研究和复杂任务规划的能力,实现了从执行指令到自主推理的飞跃。

其次是从“单设备”到“云平台”。今年8月发布的AutoGLM 2.0,开创了“智能体+云手机/云电脑”的新模式,让智能体不再受限于单一设备,能够在云端自主操作高频应用,实现更深入的推理,改变了人和AI的合作方式。

在处理“幻觉”问题上,我们的“沉思”模型能有效应对开放性、不确定且没有唯一答案的问题。这类问题需要模型反复思考、与环境频繁互动才能得出结果,模型通过不断思考和沉思,能够完成更复杂的研究任务,从而有助于解决幻觉的问题。

新京报:作为智谱的董事长和资深科研工作者,你对近年来AI大模型技术的迅猛发展有什么感受?

刘德兵:在智谱成立时,我们的团队就意识到AGI是未来的发展趋势,认知智能是必然的。虽然当时的时间节点并不明确,但我们确立了“让机器像人一样思考”的愿景。

2019年GPT-3发布时,我们的团队受到很大启发。GPT-3成为了一个重要的里程碑,对学术界产生了深远的影响。我们很早就开始投入大模型的研发,2021年推出百亿参数模型,2022年发布千亿参数模型,那个时候行业还没有爆发,直到2022年11月ChatGPT的推出才真正引爆了整个行业。在此之前,我们已经积累了多年的经验。那时投入大模型的研发需要几千万元,确实是个不小的决策。相比之下,现在投入几亿甚至几十亿已经很常见,因为大家对这个方向的信心已经建立。

我们在2023年初发布的ChatGLM模型是国内较早且效果较好的之一,后续的GLM-4以及最近的GLM-4.5、GLM-4.6等都表现出色。在这个过程中,我们深刻认识到,面对技术的浪潮,具备准确判断、原始创新和持续进化的能力是至关重要的。尽管早期自主研发投入很大,但从长远来看,这保证了技术的可控性,培养了团队,成为我们在国际竞争中赢得市场信任的重要基石。

新京报:对那些有志于投身AI行业的青年人,你有什么寄语吗?

刘德兵:我想对有志于进入AI领域的年轻人说:“知之愈明,则行之愈笃;行之愈笃,则知之愈明。”AI的最终价值在于改善民生、服务社会,我们需要通过实践不断验证,在验证中提升技术,这样才能推动产业的发展。

文/罗亦丹

编辑 王进雨

校对 张彦君 柳宝庆

来源:今日头条
原文标题:AI浪潮录|智谱刘德兵:极致技术追求与广泛链接生态才是护城河 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论