刚刚,Anthropic 发布了全新的 Claude Haiku 4.5,真是让人期待啊!
先普及一下,Claude 系列分为三种不同的模型,分别是 Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。
这次更新最让人兴奋的是,小杯的 Claude Haiku 4.5 不仅性能依然出色,而且速度更快、费用也更低了。
五个月前,Claude Sonnet 4 还是顶尖的模型之一。而现在新推出的 Haiku 4.5 在编码能力上几乎不相上下,价格却只有三分之一,速度更是提升了两倍多。

Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks
具体来说,在衡量 AI 编码能力的 SWE-bench Verified 测试集中,Haiku 4.5 的成绩达到了 73%,这意味着它直接和 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 平起平坐。
在某些任务中,比如操控电脑,Haiku 4.5 甚至反超了它的“大哥” Sonnet 4。
对于需要 AI 处理实时、低延迟任务的场景——比如聊天助手、客服代理或者结对编程助手,Haiku 4.5 既聪明又快,能让用户体验更上一层楼。
使用 Claude Code 的开发者们会发现,Haiku 4.5 让整个编程过程——从多智能体协作到快速原型开发——都变得更加流畅和高效。
当然,前两周发布的 Sonnet 4.5 依然是 Anthropic 的主打产品,属于全球编程模型的顶尖水平。但 Haiku 4.5 则提供了一个性价比更高的选择:性能几乎相当,但价格却亲民了不少。
而且它的使用方式也更灵活,Sonnet 4.5 可以把复杂问题拆解成多个小任务,然后指挥一群 Haiku 4.5 同时进行,这样的配合非常默契。
Anthropic 对 Haiku 4.5 进行了详尽的安全性和对齐性测试。
结果表明,这个模型的不当行为发生率相对较低,且比前代 Haiku 3.5 的对齐性有了显著提升。在自动化对齐评估中,Haiku 4.5 的偏离行为比 Sonnet 4.5 和 Opus 4.1 都要少。
换句话说,它是目前 Anthropic 家最安全的模型。

Comparison table of frontier models across popular benchmarks
至于定价方面,Haiku 4.5 的费用是:每百万输入 token 收费 1 美元,输出 token 则是 5 美元。
相比之下,GPT-5 mini 的价格大约是每百万输入 0.25 美元、输出 2.5 美元,而 Google 的 Gemini 2.5 Flash 也差不多。这意味着 Haiku 4.5 的成本大约是 GPT-5 mini 或 Flash 的四倍。
不过,和 Sonnet 4.5 相比,它便宜了大约三倍,性能却差不多,这对开发者来说是个降本增效的好机会。
不过得说句公道话,它在数学方面的表现还不太理想。
知名博主 Dan Shipper 在试用后发现,Haiku 在算术方面有点…糊涂。
比如在测试 Uber 账单的例子中,Haiku 虽然能准确找到所有相关邮件,但在算总额时却出错了。更搞笑的是,在他指出错误后,Haiku 竟然承认了——然后又再犯同样的错误。
Dan Shipper 对此给出了很中肯的评价:
如果你是一名开发者或者正在创业,正在用 Sonnet 4.5 打造一些复杂的智能代理应用,那么不妨考虑一下切换到 Haiku。这不仅能让你节省不少开销,而且性能上的差距几乎可以忽略不计。
要是你现在使用的是 Gemini 2.5 Flash 或者 GPT-5 mini,强烈建议你试试 Haiku。虽然它的价格稍贵一些,但在需要频繁调用工具和保持自主性的情况下,Haiku 的表现会更出色。

博客链接在这儿:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked
现在,Claude Haiku 4.5 已经在 Claude Code 和多种应用中上线了。
开发者们可以通过 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 来使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且价格也是 Anthropic 中最划算的选择。

我们根据 @zb1992 的建议,让 Claude 4.5 Haiku 试跑了一个钟表 Demo,整体体验下来,代码生成速度确实快了很多,最终的成品也很让人满意。
在后面的经典推理计算题中,Claude 4.5 Haiku 的响应速度优势更加明显,毫无疑问,这也是轻量级模型在实际应用中的核心竞争力所在。

另外,按照 The Information 的报道,估值高达 1700 亿美元的 Anthropic 最近几周告诉投行顾问,计划通过收购来引进更多的技术人才,并且扩展其在编程助手之外的其他能力——毕竟编程这一块目前还是他们的主要收入来源。

知情人士透露,由于 Anthropic 在提供编程类 AI 产品方面取得了成功,公司有可能接下来会扩展到其他开发者常用的软件工具,比如自动检测代码漏洞的工具或者辅助软件设计的工具。
还有消息称,Anthropic 也可能通过收购来开发针对特定行业的产品,例如金融服务、医疗保健或网络安全。不过,他们更偏向于金额在 5 亿美元以下的小型收购项目。
Anthropic的生态布局:对开发者和用户的双重利好
目前来看,Anthropic不仅在提升自身模型的能力,还在积极拓展其生态系统。你知道吗?在这个AI行业竞争激烈的环境中,最终能从中获益的还是那些开发者和用户——更强大的模型、更实惠的价格和更多的选择机会,让大家都能享受到科技带来的便利。
作者:莫崇宇
#欢迎关注爱范儿的官方微信公众号:爱范儿(微信号:ifanr),精彩内容第一时间送到你手中。
爱范儿|原文链接· ·新浪微博
