大模型迎来“通才”新纪元:智谱推出GLM-4.5!

21世纪经济报道记者 孙燕

现在的大模型正在从专用转向更通用的方向发展。

就在7月28号晚上,智谱推出了他们的新旗舰模型GLM-4.5,并且在Hugging Face和Model Scope平台上同步开源了。

从多个基准测试的平均分来看,GLM-4.5的综合能力已经达到了开源领域的顶尖水平:它在MMLU Pro、AIME 24、MATH 500等12项测试中,拿下了全球模型第三、国产模型第一和开源模型第一的好成绩。

而且,GLM-4.5的参数量只有DeepSeek-R1的一半、Kimi-K2的三分之一,这让它在多项标准测试中表现得更优秀,归功于GLM模型的参数效率更高。

在价格上,GLM-4.5系列的API调用费用也相对便宜:输入仅需0.8元/百万tokens,输出2元/百万tokens。

值得注意的是,智谱推出的这款SOTA级原生智能体大模型,首次将推理、编码和智能体能力融合在一起。

同样在七月,阿里云发布了通义千问AI编程大模型Qwen3-Coder,阶跃星辰则带来了新一代基础大模型Step 3,这些模型都整合了推理、代码生成和智能体功能。

民生证券的研究指出,目前全球的多模态AI正在向“多模态通才”转型,专家型模型逐渐向支持多任务的通才发展,具备任务级协同能力。

智谱之前推出了推理大模型GLM-Z1-Air和GLM-Z1-Flash、代码大模型CodeGeeX-4、智能体模型AutoGLM等,而这次的GLM-4.5则是首次在单一模型中实现推理、编码和智能体的原生结合。

在七月初的智谱开放平台产业生态大会上,智谱CEO张鹏也展示了大模型编写PPT和生成小游戏的能力,并多次提到“原生”这个词。“这些功能完全是模型自己生成的,没有借助其他工具或软件,模型的能力在不断叠加。”

业内人士指出,推理能力与智能体能力的结合,将使智能体的规划能力更强,而代码能力和智能体能力本身就高度融合。这三种能力的结合,有助于构建以模型为核心的智能体。

“现在大模型的能力越来越多样化,有文本、推理、工具等多种类型,专注于代码任务的模型也不少,但很多都‘偏科’。比如,OpenAI的o系列模型在推理上表现优秀,而Anthropic的Claude则在代码方面特别厉害。”智谱的一位负责人告诉21世纪经济报道,未来大模型的趋势是整合各种能力,成为一个全面发展的“全优生”,就像人一样,变得越来越通用,这才是实现AGI的关键。

他进一步指出,能力的融合最重要的意义在于让AI从擅长做一件事变成可以做多件事,逐渐变得更通用,更像人,解决更多问题。“OpenAI的GPT-5也是朝这个方向发展的。”

经过测试,GLM-4.5在推理、代码和智能体能力上均达到了开源模型的最高水平,其中推理能力在开源模型中排名第二。

虽然同时集成了推理、代码和智能体的能力,但阿里Qwen3-Coder主要侧重于代码任务,而阶跃星辰的Step 3则是以多模态推理为主,智谱的GLM-4.5则是为智能体应用量身打造的基础模型。

GLM-4.5发布的当天,张鹏在朋友圈中表示:“GLM上新!我们全面进入智能体基座时代!”

智谱对外表示,GLM-4.5首次在一个模型中实现了推理、编码和智能体能力的原生融合,以满足智能体应用的复杂需求。

在智谱演示的原生Agent场景中,GLM-4.5能够模拟搜索引擎、发弹幕的B站、以及微博发博等功能。此外,GLM-4.5系列还能够胜任全栈开发任务,编写复杂的应用、游戏和交互式网页。

这些背后,得益于模型原生具备的能力,包括前端网站编写、后端数据库管理以及通过接口调用工具支持各种智能体应用的能力。

前述业内人士分析,智能体可以分为以Coding(编码)为核心的智能体和基于UI(用户界面)的视觉识别智能体,而GLM-4.5主要属于前者,尤其擅长处理与编码相关的任务。“如今一切都可以Coding,智能体基座最成熟的应用场景还是与Coding Agent(编码智能体)的结合。”

在Agent Coding的场景中,GLM-4.5与Claude Code、Claude-4-Sonnet、Kimi-K2、Qwen3-Coder等模型进行了对比测试,展现出相对其他开源模型的竞争优势,尤其在工具调用的可靠性和任务完成度上表现突出。尽管GLM-4.5相比Claude-4-Sonnet还有提升空间,但在大多数场景中能够达到相当的效果。

到了7月29日,Rokid Glasses、智联招聘、脉脉、Lovart中国版“星流”、沉浸式翻译、Flowith等公司均宣布将接入GLM-4.5。

智谱还预告说,Vibe coding模式即将推出。这个模式是由OpenAI的联合创始人Andrej Karpathy提出,核心思想是通过自然语言提示让AI生成代码,从而减少手动编码的需求。也就是说,未来开发者只需用自然语言描述需求,AI就能自动生成对应的代码。

“AI正越来越多地从后台走向前台,早期的AI能力往往隐藏在后台,比如理解一句话、执行一个命令、唤醒音像等,用户对这些功能的感知并不明显。后来,像ChatGPT这样的Copilot伴随式模型和智能体应用AI Native的Agent出现了。未来,AI将深入到中间层、底层,像操作系统一样管理所有硬件、软件和数据,用户只需通过自然语言与ALM(大模型操作系统)交互,它就能帮助你调度底层能力,完成更多的任务。”张鹏在之前的演讲中畅想道。

想了解更多内容,请下载21财经APP。

来源:今日头条
原文标题:大模型迈向“通才”时代?智谱发布GLM-4.5 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《大模型迎来“通才”新纪元:智谱推出GLM-4.5!》有12条评论

  1. GLM-4.5的推出标志着大模型发展的新方向,其在多项测试中的优异表现令人期待。将推理、编码和智能体能力融合,确实是未来AI发展的关键。希望能看到更多应用场景。

    回复
  2. 智谱GLM-4.5的能力融合令人振奋,推理、编码和智能体的结合将极大提升AI的应用广度,未来的发展可能会更加多元化。

    回复
  3. GLM-4.5的推出让人看到大模型发展的新趋势,推理与代码能力的结合将极大提升AI的实用性,有望推动更多创新应用。

    回复
  4. 智谱GLM-4.5的多任务能力令人期待,它在推理、编码和智能体方面的出色表现,确实是推动AI应用发展的新动力。未来的模型可能会更具智能和灵活性。

    回复
  5. 智谱GLM-4.5在推理、编码和智能体能力上的融合,确实展现了大模型的未来方向,期待它在实际应用中的表现。

    回复
  6. 智谱GLM-4.5在参数效率和多任务能力上都表现不俗,尤其是推理和编码的结合,使得它在未来的应用场景中更具潜力。期待看到更多实际案例。

    回复
  7. 智谱GLM-4.5的推出是大模型发展的重要一步,尤其是在推理、编码和智能体能力的结合上,给未来AI应用带来了无限可能。期待它在更多场景中的表现。

    回复
  8. 智谱GLM-4.5的发布展示了大模型向通才发展的趋势,尤其是在推理与编码能力的融合上,未来的应用场景将更加丰富多彩。

    回复
  9. GLM-4.5的发布真是个好消息,推理、编码和智能体的结合让它的应用潜力更大,未来会带来更多创新的可能性。

    回复
  10. 智谱GLM-4.5的发布标志着大模型的能力大幅提升,推理、编码和智能体的结合让它在实际应用中更具优势,期待它能带来更多惊喜。

    回复
  11. GLM-4.5的推出不仅提高了大模型的整体性能,还实现了推理、编码、智能体的融合,未来在多场景应用上值得期待。

    回复
  12. GLM-4.5的发布让我们看到了大模型在多任务处理上的巨大潜力,尤其是推理和编码能力的结合,真是个令人振奋的进展。

    回复

发表评论