阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!

Qwen3-Coder: 在世界中自主编程

就在7月23日,阿里终于发布了 Qwen3-Coder,这可是他们迄今为止最强大的代码模型哦!这个模型有好几个版本,其中有个叫 Qwen3-Coder-480B-A35B-Instruct,参数总量达到了480B,激活的参数则是35B。它可以支持256K token 的上下文,最高还能扩展到1M token,真的是强大得让人惊叹!在代码生成、浏览器使用和工具使用方面表现得也非常出色,甚至与 Claude Sonnet4 旗鼓相当。你想知道它的表现如何吗?

阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!
阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!

说真的,今天早上我一醒来,发现朋友圈里满是关于 Qwen 的讨论。

谁能想到,就在一个普通的周三早上,千问团队在昨天刚把 Qwen3-235B 更新了一个小版本之后,竟然直接开源了参数最多的 Qwen3-Coder-480B-A35B,实力甚至可以与 Claude Sonnet 4 一较高下。

阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!

值得一提的是,之前 Qwen 系列最大的模型有 Qwen1.5-110B,Qwen2.5-72B,Qwen3-235B-A22B,而上次开源的编程模型是 Qwen2.5-Coder-32B。

这次的 Qwen3-Coder 直接把参数数量推到了一个新高度,功能也达到顶尖水平,并且依然选择开源,真是让人目瞪口呆。

不过仔细想想,这样的决定也并非完全无道理。接下来我会详细分析一下,阿里为什么会选择开源这样一个强大的编程模型。

在此之前,我们先来看看实际测试结果。

实战评测 Qwen3-Coder

无论跑分多高,还是得上手实际体验一下。现在已经有不少平台提供了 Qwen3-Coder 模型的使用,咱们可以很方便地进行测试。

场景一:SVG 图像生成

先来个简单的测试,之前有国外博主 Simon Willison 喜欢让大模型「生成一个骑自行车的鹈鹕的 SVG」,来看看模型能否将这种奇特的形象转化为精准的矢量图形代码。

为了避免模型只针对这个特定情况训练,我们换个要求:

生成一个皮卡丘打篮球的SVG

我在 QwenChat 的网页版上生成了一下:

阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!

对比一下 K2 的结果:

阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!

从结果来看,两个模型都能理解皮卡丘的主要特征,但 Qwen3-Coder 在身体结构的理解上明显更好,还画出了场地和篮框;而 K2 画出的「打」的动作却有点不太符合逻辑。

场景二:3D 动态网页演示

接下来我们来做一个稍微复杂的动态网页。Prompt:

使用 Three.js 创建一个逼真的三维地球仪演示。
核心要求:
地球模型:使用一个球体作为基础。应用高分辨率的真实地球纹理,包括白天地貌图和夜晚城市灯光图,并实现昼夜平滑过渡。
大气与云层:添加一个独立、半透明的云层,并使其缓慢转动。创建环绕地球的真实大气辉光效果。
光照:使用平行光模拟太阳,在地球上投射出动态的阴影,形成昼夜效果。
交互:允许用户通过鼠标自由旋转和缩放地球,支持重置视角,支持调整转动速度。地球本身需围绕轴心自转。
技术规范:构建一个完整单页网页。使用 three.js 库。代码结构需清晰、模块化。

依旧使用 QwenChat 的预览模式,结果如下:

阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!

我尝试了一下,Qwen 一次就成功了,完全符合我的要求。

QwenChat 还支持直接部署生成的网页,我把链接分享一下,大家可以去看看效果:Qwen Chat

场景三:搭配 Code Agent 使用

除了在 QwenChat 里进行问答式的代码生成,Qwen3-Coder 搭配 Code Agent 使用才算是完全体。

你可以在任何支持自定义模型的场景中使用 Qwen API,官方也推荐了几种用法:

  • 使用 Qwen Code,基于 Gemini CLI 分支构建
阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!
  • 使用 Claude Code,并自定义 Qwen3-Coder 模型
  • 使用 Cline,配置模型 API

我比较喜欢用 Claude Code,接下来看看 Qwen 的表现。记录一下具体的配置步骤:

第一步,安装 Claude Code:npm install -g @anthropic-ai/claude-code

第二步,去阿里云百炼平台,申请 API key:https://bailian.console.aliyun.com/

第三步,设置环境变量:

export ANTHROPIC_BASE_URL=https://dashscope.aliyuncs.com/api/v2/apps/claude-code-proxy

export ANTHROPIC_AUTH_TOKEN=your-dashscope-apikey

然后在项目文件夹输入claude,看到环境变量中的 API URL 设置成功,就可以开始使用了:

阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!

我测试了一个之前的个人项目,Claude Code + Qwen3 Coder 连续稳定运行了大约 11 分钟,顺利生成了1000多行代码。

阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!

根据实际测试,Qwen3-Coder 在 Claude Code 中表现非常稳定,没有出现工具调用失败的情况,成功生成了我所需的项目结构和 API 端点:

阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!

这下我可省心多了,再也不用担心 Claude 的账号了。

通过上面的测试,我觉得 Qwen3-Coder 完全达到了顶级编程模型的水平,尤其在使用 Agentic 工具方面表现相当不错,能够提升我们日常工作的效率。

代码之外:Qwen3-Coder 的核心价值

回到开头的问题:为什么阿里会在「编程」这个领域投入如此多的资源,还选择开源 Qwen 系列中最大的模型呢?

我来简单说说我的看法,供大家参考。

第一,编程是训练模型能力的绝佳场景

当大模型的预训练遇到数据瓶颈时,其能力提升往往转向强化学习等后训练阶段。

所以很多模型团队都开始集中精力提升「数学」和「编程」能力。原因也很简单,数学和编程都属于封闭场景,有明确的对错边界和反馈机制,非常适合进行强化学习。

第二,编程能力的提升 ≈ Agentic 能力的提升

训练模型编写代码,实际上是在锻炼它理解复杂逻辑、进行任务规划、调用工具和根据反馈进行自我调整的能力。

而这些能力正是构建智能体(Agent)的核心。所以说,Qwen3 Coder 就是一个「披着编程外衣的 Agent 模型」,完全可以作为通用模型或通用 Agent 的基础进行使用。

第三,编程是目前少数已经验证的落地场景

虽然大模型发展了好几年,但真正可以落地的领域并不多,而编程正好是走在前面的一个。

CursorWindsurf 到 Claude Code、Gemini CLI,随着模型编程能力的提升,AI 编程工具也迎来了快速发展,成为大模型行业为数不多已经验证了商业模式的领域。

第四,模型开源让更多开发者掌控自己的核心数据

商业模型的各种难题与 Qwen3 Coder 的崛起

说实话,闭源的商业模型虽然功能强大,但在使用上却有不少挑战。无论是 Gemini CLI 还是 Claude Code,使用成本和数据安全这两座大山始终在那儿:

  • 你知道吗?各种 AI 订阅服务每月的费用能高达 $20 或者 $200,而API调用费用更是没有上限,长期下来可是一笔不小的开支。
  • 对于国内的企业和开发者来说,把核心项目放到第三方云服务上,总是让人心里没底,安全隐患随时可能冒出来。

而 Qwen3 Coder 的出现,简直就是个游戏规则的改变者。只需不到十万元的顶配 Mac Studio,就能在本地运行这种高性能的编程模型,真的是太划算了。

更棒的是,Qwen 不仅开源了模型,还兼容了很多 Agent 工具和用法,说明 Qwen 团队在认真思考如何让这个模型更好地融入我们的日常开发流程,而不是仅仅停留在 Playground 里当个玩具。

因此,可以说 Qwen3 Coder 对技术团队真是个极具吸引力的选择。

小结:编程是人人都能掌握的超能力

总结一下,Qwen3 Coder 的巨大体量让它的编程能力远超预期,尤其是在 Agentic 任务上的规划和执行能力,几乎能与顶级的闭源模型媲美,复杂逻辑的理解和代码生成的质量都很高。

开源和本地化部署带来的高性价比和数据安全,使得 Qwen3 Coder 成为了 GPT、Claude、Gemini 的最佳替代品,真正成为了提升生产力的利器。

十年前,我曾看到一句话:「编程是最容易习得的超能力」,这句话一直激励着我学习编程。

如今,有了 Qwen3 Coder 这样的模型,编程甚至不再需要专门学习,变得人人可用,极大降低了门槛,让更多有创意但技术不强的人能够实现自己的想法。同时,也让经验丰富的程序员能够摆脱繁琐的代码和调试,专注于更具创造性的系统设计和架构工作。

编程的领域正在经历一场真正的生产力革命,我期待 Qwen 团队能继续推出更强大的模型,更期待大家能利用 Qwen3 Coder 构建出属于自己的应用和业务!

来源:知乎
原文标题:阿里开源编程模型Qwen3-Coder,性能比肩全球顶级编程模型Claude4,技术亮点和体验如何? – 硅基观察站 的回答
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《阿里开源的Qwen3-Coder编程模型,竟然可以和全球顶级的Claude4一较高下!它的技术亮点和使用体验到底如何?快来看看吧!》有8条评论

发表评论