智谱新GLM-4.6与DeepSeek V3.2国产Claude实力对决,谁能称王?

最近,国产大模型领域掀起了一阵热潮,先后推出了智谱 GLM-4.6 和 DeepSeek V3.2。这两款模型在基准测试中表现惊艳,DeepSeek V3.2 的成绩甚至超过了 Gemini 2.5 Pro;而 GLM-4.6 则轻松登上了 Hugginface 和 OpenRouter 的排行榜首位。

智谱新GLM-4.6与DeepSeek V3.2国产Claude实力对决,谁能称王?

假期结束回来,发现最近最火的竟然是节前发布的 DeepSeek-V3.2-Exp 和 GLM-4.6,真是有意思。

智谱新GLM-4.6与DeepSeek V3.2国产Claude实力对决,谁能称王?

其中一款降价了75%,

另一款则强势登顶 Hugginface 和 OpenRouter 的榜单。

智谱新GLM-4.6与DeepSeek V3.2国产Claude实力对决,谁能称王?智谱新GLM-4.6与DeepSeek V3.2国产Claude实力对决,谁能称王?

那么,我马上就掏出我假期整理好的大模型测试案例1.0,平时自己测,看看别人测试,甚至看大模型自己测,真是看得有点腻了,花点时间总结了一下。截止到2025年10月9号,目前主流的单案例测试(专指非数据集)主要分为物理模拟、SVG、前端设计和可交互3D四大类,今天我一下子全测完,还得加上 DeepSeek V3.2,测评方式还是老样子,公开所有提示语,每个模型跑三遍,取最佳结果。

有些提示语比较长,还有输出的代码和效果我都整理成一个文档了,直接在公众号后台发“dsglm”就行。

先来个常见的物理模拟热身,试试用 HTML、CSS 和 JavaScript 实现一个效果:一个小球被卡在一个旋转的六边形里。小球在地球重力的影响下,与六边形的内壁发生摩擦,弹跳看起来要自然逼真。

虽然没直接说,GLM-4.6 和 DeepSeek V3.2 都很贴心地提供了参数调整选项,可以重置小球、加快或减慢六边形的旋转速度,甚至可以取消动力。我记得 DeepSeek R1 时小球能模拟重力就已经很厉害了,而 GLM-4.6 还增加了重力参数、小球的大小,甚至摩擦力。

接下来我们再试试画个 SVG,绘制一只骑自行车的鹈鹕的 SVG 图像。

### 鹈鹕骑车大比拼:技术的奇妙之旅

这个测试真的是个老牌的经典了,左边的GLM-4.6几乎把所有元素都画得有模有样,唯一就是鹈鹕坐的位置稍微低了点。而右边的DeepSeek V3.2则让鹈鹕的脚和身体分开,方向也搞反了,连车把都消失不见了。

而且我还发现了另外16个模型生成的鹈鹕,其中有的车把没了,有的鸟缺了,有的头部朝着奇怪的方向,甚至有的连车都没画出来!

智谱新GLM-4.6与DeepSeek V3.2国产Claude实力对决,谁能称王?

而且这个测试居然还有升级版,竟然让鹈鹕骑上另一只鹈鹕!

接下来,我们要尝试画一幅鹈鹕骑在另一只鹈鹕上的SVG图像。

智谱新GLM-4.6与DeepSeek V3.2国产Claude实力对决,谁能称王?

大家猜猜哪个是GLM-4.6画的呢?

接下来我们来测测UI组件,老实说,测天气组件我都快累了,想换点新鲜的东西。于是决定设计一个响应式的仪表盘(Dashboard)界面,里面要有导航栏、数据可视化图表和用户设置面板,最好用上像Tailwind这样的现代CSS框架。我们还得确保界面对所有用户都友好,手机上也能正常显示。

按照提示,两个模型都能实现所需的元素,接下来比的就是细节了。在GLM-4.6中,当鼠标移到图标上时,可以展示更多具体信息,此外还能顺利切换主题颜色,还允许部分用户信息的修改。

接下来,我们要挑战一些更奇怪的东西,让它们复刻我每天都会见到的界面,帮我做一个Excel的克隆版本,不过只需前端部分。

这个案例也蛮新颖的,没想到加粗、斜体、下划线这些功能都能实现,甚至连SUM公式和单元格合并等功能也有接口。不过,由于无法选择多个单元格,这些功能暂时没有发挥作用。相比DeepSeek V3.2,GLM-4.6还实现了居中、偏左偏右以及单个单元格的复制、粘贴和剪切,照这样下去,Claude在Imagine with Claude中提出的实时生成各种软件原型的理念真是指日可待。

最后,来个可交互的3D界面,创建一个互动的3D粒子宇宙,得包含3种模式,还能实时渲染最多10,000个粒子,呈现出具有空间深度效果的三维视觉体验,使用Three.js来实现。

GLM-4.6同样提供了更多可调参数,让你可以更灵活地调整细节。想象一下,开着3倍速,10,000颗粒子迎面而来,这种感觉简直像在穿越时空!

最后,让我们来看看GLM-4.6如何接入最新的Claude Code V2.0吧,安装方法还是和以前一样,下面是命令:

npm install -g @anthropic-ai/claude-code

export ANTHROPIC_BASE_URL=https://api.z.ai/api/anthropic

export ANTHROPIC_AUTH_TOKEN=你获得的APIkey

AI编程的乐趣与实用性,程序员的真实感受

这次更新的一个大亮点是新加了检查点功能,用户可以随时回到之前的状态。只需按两次Esc键,或者输入/rewind,就能恢复之前的代码或对话内容,真是太方便了。

再加上GLM-4.6的超低价格,我真的很难找到不依赖AI写代码的理由了。

如果你选择Coding Plan套餐,价格仅需1.99元每百万tokens,简直比DeepSeek v3.2还要划算,算下来大约是Claude Sonnet 4.5的1/20到1/50,平均token消耗比GLM-4.5节省了30%左右。而且,之前订阅过的用户会自动升级到GLM-4.6,非常人性化。

https://zhipuaishengchan.datasink.sensorsdata.cn/t/Vh

最后想聊聊,作为一名每天都在写代码的程序员,我对AI编程的看法。最开始我有点犹豫,不想轻易使用,毕竟额度用完了就麻烦,还可能走很多弯路。但过了一段时间后,我发现,AI帮我写单元测试,或者将代码语言转换,比如把Python转成SQL,真的是省时省力,完全不需要我去查文档、导入包、配置环境,简直太方便了。

后来,随着token价格的下降,我开始在Cursor上把一些好用的GitHub项目整理成文档,让AI自己去理解和应用,效果非常不错。

智谱新GLM-4.6与DeepSeek V3.2国产Claude实力对决,谁能称王?

不过最近情况有点变化,我并不是那种遇到问题就想着写程序解决的极客类型。我通常都是遇到问题了才临时学习一下,迅速找到解决方案。

所以对我来说,编程更多的就是个工具。尤其当我看到别人的代码时,心里真的有点凉,感觉比杀鱼还要冷。但AI编程让我仿佛回到了以前那种,拿着本C#就敢去开发的勇气。感觉好像没有什么是一行代码解决不了的,如果有的话,多写几行就行了。

本文由人人都是产品经理的作者【卡尔的AI沃茨】原创/授权发布,未经许可,禁止转载。

题图来自Unsplash,基于CC0协议。

来源:今日头条
原文标题:实测智谱新GLM-4.6 VS DeepSeek V3.2-国产Claude,当之无愧 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《智谱新GLM-4.6与DeepSeek V3.2国产Claude实力对决,谁能称王?》有6条评论

  1. 这两款模型的表现真是让人惊叹,尤其是GLM-4.6在排行榜上的表现,完全不负众望。测试案例也很有意思,物理模拟和SVG绘制的对比很有启发性。

    回复
  2. 这场对决真是精彩,GLM-4.6和DeepSeek V3.2各有千秋。特别是物理模拟的表现,令人耳目一新。期待后续更多的测试结果!

    回复
  3. 这场模型对决让我对国产大模型的未来更加期待,GLM-4.6的细节处理真是出色,尤其在物理模拟上表现得相当自如。DeepSeek V3.2也不甘示弱,未来的竞争会越来越激烈!

    回复
  4. 模型之间的对比真是让人眼前一亮,尤其是GLM-4.6在物理模拟中的表现,细节处理得非常到位,值得期待后续的应用。

    回复
  5. DeepSeek V3.2的降价策略真是让人惊讶,能在基准测试中超越Gemini 2.5 Pro,着实令人期待它的后续发展。

    回复
  6. 这场对决让我看到了国产大模型的潜力,特别是GLM-4.6在细节处理上非常到位,物理模拟的效果让人印象深刻。期待未来能有更多这样的创新!

    回复

发表评论