阿里开源的Qwen3-Coder编程模型，竟然可以和全球顶级的Claude4一较高下！它的技术亮点和使用体验到底如何？快来看看吧！

Qwen3-Coder: 在世界中自主编程

就在7月23日，阿里终于发布了 Qwen3-Coder，这可是他们迄今为止最强大的代码模型哦！这个模型有好几个版本，其中有个叫 Qwen3-Coder-480B-A35B-Instruct，参数总量达到了480B，激活的参数则是35B。它可以支持256K token 的上下文，最高还能扩展到1M token，真的是强大得让人惊叹！在代码生成、浏览器使用和工具使用方面表现得也非常出色，甚至与 Claude Sonnet4 旗鼓相当。你想知道它的表现如何吗？

阿里开源的Qwen3-Coder编程模型，竟然可以和全球顶级的Claude4一较高下！它的技术亮点和使用体验到底如何？快来看看吧！

说真的，今天早上我一醒来，发现朋友圈里满是关于 Qwen 的讨论。

你可能感兴趣：Qoder，助你从“执行者”华丽转身为“架构师”！

谁能想到，就在一个普通的周三早上，千问团队在昨天刚把 Qwen3-235B 更新了一个小版本之后，竟然直接开源了参数最多的 Qwen3-Coder-480B-A35B，实力甚至可以与 Claude Sonnet 4 一较高下。

值得一提的是，之前 Qwen 系列最大的模型有 Qwen1.5-110B，Qwen2.5-72B，Qwen3-235B-A22B，而上次开源的编程模型是 Qwen2.5-Coder-32B。

这次的 Qwen3-Coder 直接把参数数量推到了一个新高度，功能也达到顶尖水平，并且依然选择开源，真是让人目瞪口呆。

不过仔细想想，这样的决定也并非完全无道理。接下来我会详细分析一下，阿里为什么会选择开源这样一个强大的编程模型。

在此之前，我们先来看看实际测试结果。

实战评测 Qwen3-Coder

无论跑分多高，还是得上手实际体验一下。现在已经有不少平台提供了 Qwen3-Coder 模型的使用，咱们可以很方便地进行测试。

场景一：SVG 图像生成

先来个简单的测试，之前有国外博主 Simon Willison 喜欢让大模型「生成一个骑自行车的鹈鹕的 SVG」，来看看模型能否将这种奇特的形象转化为精准的矢量图形代码。

为了避免模型只针对这个特定情况训练，我们换个要求：

生成一个皮卡丘打篮球的SVG

我在 QwenChat 的网页版上生成了一下：

对比一下 K2 的结果：

从结果来看，两个模型都能理解皮卡丘的主要特征，但 Qwen3-Coder 在身体结构的理解上明显更好，还画出了场地和篮框；而 K2 画出的「打」的动作却有点不太符合逻辑。

场景二：3D 动态网页演示

接下来我们来做一个稍微复杂的动态网页。Prompt：

使用 Three.js 创建一个逼真的三维地球仪演示。
核心要求:
地球模型:使用一个球体作为基础。应用高分辨率的真实地球纹理，包括白天地貌图和夜晚城市灯光图，并实现昼夜平滑过渡。
大气与云层:添加一个独立、半透明的云层，并使其缓慢转动。创建环绕地球的真实大气辉光效果。
光照:使用平行光模拟太阳，在地球上投射出动态的阴影，形成昼夜效果。
交互:允许用户通过鼠标自由旋转和缩放地球，支持重置视角，支持调整转动速度。地球本身需围绕轴心自转。
技术规范:构建一个完整单页网页。使用 three.js 库。代码结构需清晰、模块化。

依旧使用 QwenChat 的预览模式，结果如下：

我尝试了一下，Qwen 一次就成功了，完全符合我的要求。

QwenChat 还支持直接部署生成的网页，我把链接分享一下，大家可以去看看效果：Qwen Chat

场景三：搭配 Code Agent 使用

除了在 QwenChat 里进行问答式的代码生成，Qwen3-Coder 搭配 Code Agent 使用才算是完全体。

你可以在任何支持自定义模型的场景中使用 Qwen API，官方也推荐了几种用法：

使用 Qwen Code，基于 Gemini CLI 分支构建

使用 Claude Code，并自定义 Qwen3-Coder 模型
使用 Cline，配置模型 API

我比较喜欢用 Claude Code，接下来看看 Qwen 的表现。记录一下具体的配置步骤：

第一步，安装 Claude Code：npm install -g @anthropic-ai/claude-code

第二步，去阿里云百炼平台，申请 API key：https://bailian.console.aliyun.com/

第三步，设置环境变量：

export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy

export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey

然后在项目文件夹输入claude，看到环境变量中的 API URL 设置成功，就可以开始使用了：

我测试了一个之前的个人项目，Claude Code + Qwen3 Coder 连续稳定运行了大约 11 分钟，顺利生成了1000多行代码。

根据实际测试，Qwen3-Coder 在 Claude Code 中表现非常稳定，没有出现工具调用失败的情况，成功生成了我所需的项目结构和 API 端点：

这下我可省心多了，再也不用担心 Claude 的账号了。

通过上面的测试，我觉得 Qwen3-Coder 完全达到了顶级编程模型的水平，尤其在使用 Agentic 工具方面表现相当不错，能够提升我们日常工作的效率。

代码之外：Qwen3-Coder 的核心价值

回到开头的问题：为什么阿里会在「编程」这个领域投入如此多的资源，还选择开源 Qwen 系列中最大的模型呢？

我来简单说说我的看法，供大家参考。

第一，编程是训练模型能力的绝佳场景

当大模型的预训练遇到数据瓶颈时，其能力提升往往转向强化学习等后训练阶段。

所以很多模型团队都开始集中精力提升「数学」和「编程」能力。原因也很简单，数学和编程都属于封闭场景，有明确的对错边界和反馈机制，非常适合进行强化学习。

第二，编程能力的提升 ≈ Agentic 能力的提升

训练模型编写代码，实际上是在锻炼它理解复杂逻辑、进行任务规划、调用工具和根据反馈进行自我调整的能力。

而这些能力正是构建智能体（Agent）的核心。所以说，Qwen3 Coder 就是一个「披着编程外衣的 Agent 模型」，完全可以作为通用模型或通用 Agent 的基础进行使用。

第三，编程是目前少数已经验证的落地场景

虽然大模型发展了好几年，但真正可以落地的领域并不多，而编程正好是走在前面的一个。

从 Cursor、Windsurf 到 Claude Code、Gemini CLI，随着模型编程能力的提升，AI 编程工具也迎来了快速发展，成为大模型行业为数不多已经验证了商业模式的领域。

第四，模型开源让更多开发者掌控自己的核心数据

商业模型的各种难题与 Qwen3 Coder 的崛起

说实话，闭源的商业模型虽然功能强大，但在使用上却有不少挑战。无论是 Gemini CLI 还是 Claude Code，使用成本和数据安全这两座大山始终在那儿：

你知道吗？各种 AI 订阅服务每月的费用能高达 $20 或者 $200，而API调用费用更是没有上限，长期下来可是一笔不小的开支。
对于国内的企业和开发者来说，把核心项目放到第三方云服务上，总是让人心里没底，安全隐患随时可能冒出来。

而 Qwen3 Coder 的出现，简直就是个游戏规则的改变者。只需不到十万元的顶配 Mac Studio，就能在本地运行这种高性能的编程模型，真的是太划算了。

更棒的是，Qwen 不仅开源了模型，还兼容了很多 Agent 工具和用法，说明 Qwen 团队在认真思考如何让这个模型更好地融入我们的日常开发流程，而不是仅仅停留在 Playground 里当个玩具。

因此，可以说 Qwen3 Coder 对技术团队真是个极具吸引力的选择。

小结：编程是人人都能掌握的超能力

总结一下，Qwen3 Coder 的巨大体量让它的编程能力远超预期，尤其是在 Agentic 任务上的规划和执行能力，几乎能与顶级的闭源模型媲美，复杂逻辑的理解和代码生成的质量都很高。

开源和本地化部署带来的高性价比和数据安全，使得 Qwen3 Coder 成为了 GPT、Claude、Gemini 的最佳替代品，真正成为了提升生产力的利器。

十年前，我曾看到一句话：「编程是最容易习得的超能力」，这句话一直激励着我学习编程。

如今，有了 Qwen3 Coder 这样的模型，编程甚至不再需要专门学习，变得人人可用，极大降低了门槛，让更多有创意但技术不强的人能够实现自己的想法。同时，也让经验丰富的程序员能够摆脱繁琐的代码和调试，专注于更具创造性的系统设计和架构工作。

编程的领域正在经历一场真正的生产力革命，我期待 Qwen 团队能继续推出更强大的模型，更期待大家能利用 Qwen3 Coder 构建出属于自己的应用和业务！

来源：知乎

原文标题：阿里开源编程模型Qwen3-Coder，性能比肩全球顶级编程模型Claude4，技术亮点和体验如何？ – 硅基观察站的回答

原文链接：https://www.zhihu.com/question/1931239650753769546/answer/1951037558575306018

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！