最近我试了几道海龟汤类型的推理题,发现自己的推理能力提升了不少。你知道吗,思维过程中不断试探和多角度分析,结果导致token的消耗也蛮大的!
你们使用这个工具的体验如何?这个计划值得入手吗?

这个页面,是 GLM-4.7 自己写的。
我给你个提示,没改过,直接放出来。
黑色背景搭配荧光绿,3D几何体在旋转,代码演示区还有打字机效果,甚至鼠标光标都变成了霓虹绿的小圆点。
非常感谢智谱大大让我参与新模型的内测。
我先试了一圈,先给个结论:
这是目前感觉上最接近
Claude Sonnet 4.5的国产模型。
01|先聊聊这个新模型
上周我提到过,智谱是“源”神。
这一周,它又有了新动作。
GLM-4.7,智谱最新的旗舰模型,专注于 Agentic Coding。
什么是 Agentic 呢?
简单来说,它能接收到完整的任务后,自己分析、执行并完成交付。
上下文窗口达到200K tokens,最大输出128K tokens,还支持思考模式。

官方的成绩相当不错。
编程测试 SWE-bench 的准确率达到了73.8%。
而多语言版本 SWE-bench Multilingual 更是厉害,达到了66.7%,比之前的版本提升了12.9%。
在终端操作 Terminal Bench 上,表现也很不错,达到了41%,工具调用基准 τ²-Bench 和浏览器任务 BrowserComp 也都在开源 SOTA 之列。
不仅仅是代码能力强。
在 HLE(人类最后一场考试)中,直接拿下了42.8%,提升了12.4%。

重点来了:GLM-4.7 已经在 Hugging Face 上线,MIT 协议,完全开源。
数据好看是其一,体验才是真正的关键。
接下来看看实测的效果。
PS:以下所有测试都是在 z.ai 完成的,方便分享。
02|鹈鹕骑车 SVG
这是经典的 SVG 矢量图测试。
我用同样的提示词,跑了5个模型。
Create code for an SVG of a pelican riding a bicycle as nicely as you can.

5个模型,各展风采。
GLM-4.7 的扁平插画风格,橙色大嘴、灰蓝色自行车,地面阴影处理得还不错。
唯一的不足是,鹈鹕少了一条腿。
Claude Opus 4.5 的表现最为用心,蓝天白云、马路、太阳,还有远处飞的小鸟,细节满分。
稳定发挥。
Claude Sonnet 4.5 简约大方,红色自行车搭配白色鹈鹕。
和 GLM-4.7 差不多,只是少了自行车的脚蹬。
GPT-5.2 Thinking 结果不太理想,鹈鹕的结构混乱,配色也不太协调。
Gemini 3 Pro 的鹈鹕最为美观,不过自行车的轮子却散架了,两个车轮飘来飘去。
单从这个测试来看,GLM-4.7 的表现一点也不逊色。
03|天气卡片
这个测试主要考验前端的审美。
四种天气状态,要有动效,还得有质感。
原创提示词的核心思路是:
不要单纯那种渐变蓝天白云的“应用商店免费 App”感觉,而是要像高端手表表盘那样,精致、克制、高级。
完整的提示词我会放在文末,随便拿去用。
看看 GLM-4.7 的结果。
https://chat.z.ai/space/x0wucactft30-art
晴天的效果是失焦光斑,暖金色的漂浮效果,真是让人惊艳。
而雨、雪、风三种状态则显得比较中规中矩,但整体配色统一,底部信息排版也很干净。
一次生成,没有任何修改。
整体给人一种简洁的高级感。

04|太空射击游戏
这个测试考验的是复杂逻辑和一次成型的能力。
给出一个提示词,生成一个完整可玩的游戏。
霓虹 + 几何 + 深空。飞船是青色三角形,敌人是红色六边形,视觉效果完全依赖发光描边和粒子效果。
完整的提示词同样放在文末。
GLM-4.7 的效果超出预期。
https://chat.z.ai/space/s06ubaqvrf00-art
开始界面显示“NEON VECTOR – TACTICAL OVERDRIVE”,霓虹字体带有发光效果。

游戏中青色三角飞船、红色六边形敌人,还有缓慢滚动的星空背景。
甚至配有“biu biu biu”的音效。

失败界面显示红色霓虹“MISSION FAILED”,还可以重试。

唯一的小问题是射击动作有个bug,稍微修一下就好了。
整体视觉效果非常棒,完全像是一个成熟的独立游戏Demo。
05|GLM-4.7 自我介绍页
回到最开始的那个测试。
让 GLM-4.7 为自己制作产品页,测试的是布局、审美和代码结构。
原创提示词的核心思路是:
参考 Apple 发布会的克制感,或者 Teenage Engineering 的工业设计风格。配色用黑底加荧光绿点缀。
完整提示词同样在文末。
https://chat.z.ai/space/t0kuxa7w1d91-art
效果大家可以看到。
可以说是“零 AI 味”的前端设计。

Hero 区域展示了3D旋转的几何体,代码演示区还有打字机动画。
往下滑动,功能介绍采用卡片布局,Benchmark 用 Apple 风格的对比卡片。
最后以“TRUE OPEN SOURCE”收尾,MIT LICENSE 标签挂在顶部。

整个配色风格一致,鼠标变成了霓虹绿的小圆点,hover 交互也做得很到位。
这个效果直接用作官网也不为过。
说实话,这种毫无 AI 感的网页设计,我之前只在 Gemini 3 Pro 上见过。
GLM-4.7 是第二项。
06|体验总结
来个小结,基于四次测试的结果。
GLM-4.7 的前端设计跟 Gemini 3 Pro 非常相似,而编程能力几乎与 Claude Sonnet 4.5 持平。
虽然和 Opus 4.5 还有些许差距,但在国内的模型中,算是顶尖的了。
最重要的是,使用起来感觉真不错。
几乎所有的测试都能一次性得到结果,根本不需要反复调试。
我一开始就说它是 Claude 的强力替代品,现在看来依然如此。
07|如何使用 GLM-4.7
想体验的朋友,有几个方式可以入手。
可以通过 z.ai 在线使用。
API 也已经上线,模型名称就是 glm-4.7。
本地部署方面,已经在 Hugging Face 发布,并且遵循 MIT 协议。
如果你是开发者,强烈推荐他们的「Coding Plan」套餐。
首月费用仅需 20 元人民币!
使用量是 Claude 的三倍,性价比真是高得让人惊喜。
现在已经自动升级到最新的 GLM-4.7。
GLM Coding Plan:https://www.bigmodel.cn/glm-coding
总结
在九月底,智谱推出了 GLM-4.6。
这标志着国产平替的正式开始。
今天,GLM-4.7 也上线了。
距离顶级模型已经相当接近。
「源」神智谱,真的是太用功了。
附录:文中提到的关键词
天气卡片
你是一位曾主导 Apple Weather、Nothing OS、Panic 软件界面设计的顶级创意前端工程师。请创建一个令人惊艳的动画天气卡片组件。
需要展示四种天气状态:晴天、降雨、下雪、大风。
视觉方向(跳出天气 App 的俗套):
- 不要渐变蓝天白云,不要卡通图标,这些太"应用商店免费 App"了
- 参考方向:Apple Weather 的层次感和流动光影,Nothing 的点阵极简风,或 Teenage Engineering 的工业仪表盘美学
- 配色建议:深灰/纯黑底色,天气元素用克制的颜色(暖橙代表晴天、冷蓝代表雨雪、青白代表风)
- 整体气质要像高端手表表盘或豪车仪表盘,精密、克制、高级
四种天气的动效设计:
- 晴天:不要画太阳。用光线粒子缓慢扩散,或用一个发光的抽象光球脉动呼吸,温暖但不刺眼
- 降雨:雨滴要有物理感,下落速度有快有慢,落地时有微妙的涟漪或溅射效果,整体有湿润的氛围
- 下雪:雪花大小不一,飘落轨迹有随机的飘摇感,可以有轻微的景深模糊(近大远小)
- 大风:用流动的线条或粒子表现风的方向和力度,有呼啸的速度感,元素要有被吹动的感觉
布局要求:
- 四张卡片并排展示,每张卡片像一个独立的艺术装置
- 卡片之间有呼吸感的间距
- 每张卡片底部显示天气名称和温度(用优雅的无衬线字体)
- 鼠标悬停时卡片有微妙的上浮和光晕响应
技术:
- 可以使用 Three.js、GSAP、Canvas、CSS 动画(通过 CDN 引入)
- 单个 HTML 文件
- 优先视觉效果,不追求兼容性
核心目标:让看到这个页面的人觉得「这是某个 200美元/月 订阅制天气 App 的官网展示」,而不是一个普通的天气组件 demo。
太空射击游戏
你是一位擅长视觉特效的游戏开发者。请创建一个复古未来风格的太空射击游戏。
视觉风格:
- 深空背景,有缓慢飘动的星点(分远近两层,形成视差)
- 玩家飞船是简洁的几何形状(三角形或多边形),青色霓虹描边
- 敌人是红色/橙色的几何形状,缓慢从上方下落
- 子弹是明亮的光线,带有短促的拖尾效果
- 击中敌人时爆发橙红色粒子,像烟花散开
游戏机制:
- 键盘方向键或 WASD 控制飞船移动
- 空格键发射子弹
- 敌人持续从上方生成并下落
- 被敌人撞到或敌人到达底部,游戏结束
- 顶部显示分数
动效要求:
- 星空背景持续缓慢滚动,营造前进感
- 飞船移动时有轻微倾斜动画
- 爆炸粒子有物理感,先快后慢消散
- 游戏结束时画面轻微震动
技术:
- 单个 HTML 文件
- 使用 Canvas
- 60fps 流畅运行
目标:让人觉得这是 Steam 上 ¥18 独立游戏的试玩 Demo。
GLM-4.7 自我介绍页
你是一位曾主导 Apple 发布会网页、Stripe 官网、Raycast 产品页的顶级创意前端工程师。请为「GLM-4.7」创建一个让人过目不忘的产品发布页面。
关于 GLM-4.7:
- 智谱最新旗舰模型,定义 Agentic Coding 新标准
- 200K 上下文,128K 最大输出
- LiveCodeBench 开源第一,超越 Claude Sonnet 4.5
- 即将 MIT 协议完全开源
视觉方向(跳出 AI 产品的俗套):
- 不要蓝紫渐变,不要赛博朋克风,这些太"AI味"了
- 参考方向:Apple 产品发布页的克制高级感,或 Nothing Phone 的黑白点缀荧光色,或 Teenage Engineering 的工业设计感
- 配色建议:深灰/纯黑为主,搭配一个高饱和度的点缀色(亮橙、荧光绿、电光蓝任选其一),大面积留白
- 字体要有力量感:主标题超大、加粗,形成强烈的视觉锤
Hero 区域:
- 用一个抽象的 3D 动态元素作为主视觉(可以是旋转的几何体、流动的线条、或呼吸感的光球)
- 标题文字做成主角,够大够震撼
- 加入一个实时的代码生成动画:黑底绿字/白字的终端风格,代码逐行打出
动效:
- 背景元素有缓慢的持续运动
- 滚动时内容块有视差和渐入效果
- 鼠标移动时有微妙的交互响应
技术:
- 可以使用 Three.js、GSAP、Lottie 等库(通过 CDN 引入)
- 单个 HTML 文件
- 不追求兼容性,优先视觉效果
核心目标:让看到这个页面的人觉得「这不可能是 AI 一次生成的」。
我是木易,Top2 + 美国 Top10 CS 硕士,现在是一名 AI 产品经理。
关注「AI信息Gap」,让 AI 成为你的强大助手。












看到鹈鹕骑自行车的插画效果,我忍不住想试试这个功能。这个模型的创意表现如何?
从测试结果来看,稳定性和准确性都有所提升,值得尝试一下,不要错过。
这款模型支持200K tokens的上下文窗口,真的很厉害!这个功能在实际使用中能带来多大的便利呢?
听说它的编程准确率达到了73.8%,这对开发者来说是个不错的消息,值得关注。
从文章来看,GLM-4.7在多语言支持上进步很大,值得关注!