就在7月23日,阿里终于发布了 Qwen3-Coder,这可是他们迄今为止最强大的代码模型哦!这个模型有好几个版本,其中有个叫 Qwen3-Coder-480B-A35B-Instruct,参数总量达到了480B,激活的参数则是35B。它可以支持256K token 的上下文,最高还能扩展到1M token,真的是强大得让人惊叹!在代码生成、浏览器使用和工具使用方面表现得也非常出色,甚至与 Claude Sonnet4 旗鼓相当。你想知道它的表现如何吗?


说真的,今天早上我一醒来,发现朋友圈里满是关于 Qwen 的讨论。
谁能想到,就在一个普通的周三早上,千问团队在昨天刚把 Qwen3-235B 更新了一个小版本之后,竟然直接开源了参数最多的 Qwen3-Coder-480B-A35B,实力甚至可以与 Claude Sonnet 4 一较高下。

值得一提的是,之前 Qwen 系列最大的模型有 Qwen1.5-110B,Qwen2.5-72B,Qwen3-235B-A22B,而上次开源的编程模型是 Qwen2.5-Coder-32B。
这次的 Qwen3-Coder 直接把参数数量推到了一个新高度,功能也达到顶尖水平,并且依然选择开源,真是让人目瞪口呆。
不过仔细想想,这样的决定也并非完全无道理。接下来我会详细分析一下,阿里为什么会选择开源这样一个强大的编程模型。
在此之前,我们先来看看实际测试结果。
实战评测 Qwen3-Coder
无论跑分多高,还是得上手实际体验一下。现在已经有不少平台提供了 Qwen3-Coder 模型的使用,咱们可以很方便地进行测试。
场景一:SVG 图像生成
先来个简单的测试,之前有国外博主 Simon Willison 喜欢让大模型「生成一个骑自行车的鹈鹕的 SVG」,来看看模型能否将这种奇特的形象转化为精准的矢量图形代码。
为了避免模型只针对这个特定情况训练,我们换个要求:
生成一个皮卡丘打篮球的SVG
我在 QwenChat 的网页版上生成了一下:

对比一下 K2 的结果:

从结果来看,两个模型都能理解皮卡丘的主要特征,但 Qwen3-Coder 在身体结构的理解上明显更好,还画出了场地和篮框;而 K2 画出的「打」的动作却有点不太符合逻辑。
场景二:3D 动态网页演示
接下来我们来做一个稍微复杂的动态网页。Prompt:
使用 Three.js 创建一个逼真的三维地球仪演示。
核心要求:
地球模型:使用一个球体作为基础。应用高分辨率的真实地球纹理,包括白天地貌图和夜晚城市灯光图,并实现昼夜平滑过渡。
大气与云层:添加一个独立、半透明的云层,并使其缓慢转动。创建环绕地球的真实大气辉光效果。
光照:使用平行光模拟太阳,在地球上投射出动态的阴影,形成昼夜效果。
交互:允许用户通过鼠标自由旋转和缩放地球,支持重置视角,支持调整转动速度。地球本身需围绕轴心自转。
技术规范:构建一个完整单页网页。使用 three.js 库。代码结构需清晰、模块化。
依旧使用 QwenChat 的预览模式,结果如下:

我尝试了一下,Qwen 一次就成功了,完全符合我的要求。
QwenChat 还支持直接部署生成的网页,我把链接分享一下,大家可以去看看效果:Qwen Chat
场景三:搭配 Code Agent 使用
除了在 QwenChat 里进行问答式的代码生成,Qwen3-Coder 搭配 Code Agent 使用才算是完全体。
你可以在任何支持自定义模型的场景中使用 Qwen API,官方也推荐了几种用法:
- 使用 Qwen Code,基于 Gemini CLI 分支构建

- 使用 Claude Code,并自定义 Qwen3-Coder 模型
- 使用 Cline,配置模型 API
我比较喜欢用 Claude Code,接下来看看 Qwen 的表现。记录一下具体的配置步骤:
第一步,安装 Claude Code:npm install -g @anthropic-ai/claude-code
第二步,去阿里云百炼平台,申请 API key:https://bailian.console.aliyun.com/
第三步,设置环境变量:
export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy
export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey
然后在项目文件夹输入claude,看到环境变量中的 API URL 设置成功,就可以开始使用了:

我测试了一个之前的个人项目,Claude Code + Qwen3 Coder 连续稳定运行了大约 11 分钟,顺利生成了1000多行代码。

根据实际测试,Qwen3-Coder 在 Claude Code 中表现非常稳定,没有出现工具调用失败的情况,成功生成了我所需的项目结构和 API 端点:

这下我可省心多了,再也不用担心 Claude 的账号了。
通过上面的测试,我觉得 Qwen3-Coder 完全达到了顶级编程模型的水平,尤其在使用 Agentic 工具方面表现相当不错,能够提升我们日常工作的效率。
代码之外:Qwen3-Coder 的核心价值
回到开头的问题:为什么阿里会在「编程」这个领域投入如此多的资源,还选择开源 Qwen 系列中最大的模型呢?
我来简单说说我的看法,供大家参考。
第一,编程是训练模型能力的绝佳场景
当大模型的预训练遇到数据瓶颈时,其能力提升往往转向强化学习等后训练阶段。
所以很多模型团队都开始集中精力提升「数学」和「编程」能力。原因也很简单,数学和编程都属于封闭场景,有明确的对错边界和反馈机制,非常适合进行强化学习。
第二,编程能力的提升 ≈ Agentic 能力的提升
训练模型编写代码,实际上是在锻炼它理解复杂逻辑、进行任务规划、调用工具和根据反馈进行自我调整的能力。
而这些能力正是构建智能体(Agent)的核心。所以说,Qwen3 Coder 就是一个「披着编程外衣的 Agent 模型」,完全可以作为通用模型或通用 Agent 的基础进行使用。
第三,编程是目前少数已经验证的落地场景
虽然大模型发展了好几年,但真正可以落地的领域并不多,而编程正好是走在前面的一个。
从 Cursor、Windsurf 到 Claude Code、Gemini CLI,随着模型编程能力的提升,AI 编程工具也迎来了快速发展,成为大模型行业为数不多已经验证了商业模式的领域。
第四,模型开源让更多开发者掌控自己的核心数据
商业模型的各种难题与 Qwen3 Coder 的崛起
说实话,闭源的商业模型虽然功能强大,但在使用上却有不少挑战。无论是 Gemini CLI 还是 Claude Code,使用成本和数据安全这两座大山始终在那儿:
- 你知道吗?各种 AI 订阅服务每月的费用能高达 $20 或者 $200,而API调用费用更是没有上限,长期下来可是一笔不小的开支。
- 对于国内的企业和开发者来说,把核心项目放到第三方云服务上,总是让人心里没底,安全隐患随时可能冒出来。
而 Qwen3 Coder 的出现,简直就是个游戏规则的改变者。只需不到十万元的顶配 Mac Studio,就能在本地运行这种高性能的编程模型,真的是太划算了。
更棒的是,Qwen 不仅开源了模型,还兼容了很多 Agent 工具和用法,说明 Qwen 团队在认真思考如何让这个模型更好地融入我们的日常开发流程,而不是仅仅停留在 Playground 里当个玩具。
因此,可以说 Qwen3 Coder 对技术团队真是个极具吸引力的选择。
小结:编程是人人都能掌握的超能力
总结一下,Qwen3 Coder 的巨大体量让它的编程能力远超预期,尤其是在 Agentic 任务上的规划和执行能力,几乎能与顶级的闭源模型媲美,复杂逻辑的理解和代码生成的质量都很高。
开源和本地化部署带来的高性价比和数据安全,使得 Qwen3 Coder 成为了 GPT、Claude、Gemini 的最佳替代品,真正成为了提升生产力的利器。
十年前,我曾看到一句话:「编程是最容易习得的超能力」,这句话一直激励着我学习编程。
如今,有了 Qwen3 Coder 这样的模型,编程甚至不再需要专门学习,变得人人可用,极大降低了门槛,让更多有创意但技术不强的人能够实现自己的想法。同时,也让经验丰富的程序员能够摆脱繁琐的代码和调试,专注于更具创造性的系统设计和架构工作。
编程的领域正在经历一场真正的生产力革命,我期待 Qwen 团队能继续推出更强大的模型,更期待大家能利用 Qwen3 Coder 构建出属于自己的应用和业务!











Qwen3-Coder的开源决定让我有点意外,阿里这是在做什么大布局吗?
在使用Qwen3-Coder时,注意它的上下文限制,256K token可能会影响复杂项目的运行。
Qwen3-Coder的实际使用体验真的很棒,生成的代码准确性如何?
我在使用Qwen3-Coder时发现,它生成的SVG图形的细节处理确实出色,尤其在动态效果方面。
在实际测试中,我发现Qwen3-Coder生成的代码有时需要手动调整,尤其在复杂场景下。
我也尝试了生成皮卡丘的SVG,结果的细节确实很惊艳,尤其是场地的设计,超出我的预期!
我尝试生成了3D地球仪,结果相当出色,尤其是光照效果,真的超乎我的预期!
实际测试中遇到的问题让人思考,如何才能更好地优化生成的代码?