Claude新模型震撼来袭：速度翻倍、价格大幅降低，编程实力直追GPT-5！

刚刚，Anthropic 发布了全新的 Claude Haiku 4.5，真是让人期待啊！

先普及一下，Claude 系列分为三种不同的模型，分别是 Claude Opus（大杯）、Sonnet（中杯）和 Haiku（小杯）。

你可能感兴趣：claude实战经验分享：一个开发者的真实使用记录

这次更新最让人兴奋的是，小杯的 Claude Haiku 4.5 不仅性能依然出色，而且速度更快、费用也更低了。

五个月前，Claude Sonnet 4 还是顶尖的模型之一。而现在新推出的 Haiku 4.5 在编码能力上几乎不相上下，价格却只有三分之一，速度更是提升了两倍多。

Claude新模型震撼来袭：速度翻倍、价格大幅降低，编程实力直追GPT-5！

Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

具体来说，在衡量 AI 编码能力的 SWE-bench Verified 测试集中，Haiku 4.5 的成绩达到了 73%，这意味着它直接和 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 平起平坐。

在某些任务中，比如操控电脑，Haiku 4.5 甚至反超了它的“大哥” Sonnet 4。

对于需要 AI 处理实时、低延迟任务的场景——比如聊天助手、客服代理或者结对编程助手，Haiku 4.5 既聪明又快，能让用户体验更上一层楼。

使用 Claude Code 的开发者们会发现，Haiku 4.5 让整个编程过程——从多智能体协作到快速原型开发——都变得更加流畅和高效。

当然，前两周发布的 Sonnet 4.5 依然是 Anthropic 的主打产品，属于全球编程模型的顶尖水平。但 Haiku 4.5 则提供了一个性价比更高的选择：性能几乎相当，但价格却亲民了不少。

而且它的使用方式也更灵活，Sonnet 4.5 可以把复杂问题拆解成多个小任务，然后指挥一群 Haiku 4.5 同时进行，这样的配合非常默契。

Anthropic 对 Haiku 4.5 进行了详尽的安全性和对齐性测试。

结果表明，这个模型的不当行为发生率相对较低，且比前代 Haiku 3.5 的对齐性有了显著提升。在自动化对齐评估中，Haiku 4.5 的偏离行为比 Sonnet 4.5 和 Opus 4.1 都要少。

换句话说，它是目前 Anthropic 家最安全的模型。

Claude新模型震撼来袭：速度翻倍、价格大幅降低，编程实力直追GPT-5！

Comparison table of frontier models across popular benchmarks

至于定价方面，Haiku 4.5 的费用是：每百万输入 token 收费 1 美元，输出 token 则是 5 美元。

相比之下，GPT-5 mini 的价格大约是每百万输入 0.25 美元、输出 2.5 美元，而 Google 的 Gemini 2.5 Flash 也差不多。这意味着 Haiku 4.5 的成本大约是 GPT-5 mini 或 Flash 的四倍。

不过，和 Sonnet 4.5 相比，它便宜了大约三倍，性能却差不多，这对开发者来说是个降本增效的好机会。

不过得说句公道话，它在数学方面的表现还不太理想。

知名博主 Dan Shipper 在试用后发现，Haiku 在算术方面有点…糊涂。

比如在测试 Uber 账单的例子中，Haiku 虽然能准确找到所有相关邮件，但在算总额时却出错了。更搞笑的是，在他指出错误后，Haiku 竟然承认了——然后又再犯同样的错误。

Dan Shipper 对此给出了很中肯的评价：

如果你是一名开发者或者正在创业，正在用 Sonnet 4.5 打造一些复杂的智能代理应用，那么不妨考虑一下切换到 Haiku。这不仅能让你节省不少开销，而且性能上的差距几乎可以忽略不计。

要是你现在使用的是 Gemini 2.5 Flash 或者 GPT-5 mini，强烈建议你试试 Haiku。虽然它的价格稍贵一些，但在需要频繁调用工具和保持自主性的情况下，Haiku 的表现会更出色。

Claude新模型震撼来袭：速度翻倍、价格大幅降低，编程实力直追GPT-5！