机器之心报道
机器之心编辑部
你会掏钱吗?
说来也巧,就在 Sam Altman 宣布发布两个开源推理模型的半个小时之前,Anthropic 已经抢先发布了他们的新模型 Claude Opus 4.1。
以前都是 OpenAI 在抢风头,这下轮到它们被“截胡”了!历史的戏剧性可真是让人惊叹!
如果你算一下他们发推的时间,简直就是前后脚的事情。难道是 Anthropic 早就知道了消息,还是恰好赶上了?又或者它们误以为 OpenAI 要发布 GPT-5,急着放出模型?时间差得这么近,真不能说是偶然。你觉得呢?


总的来说,国外这些公司推出新模型的节奏差不多都是这样的。

Claude Opus 4.1 登场
最近推出的 Claude Opus 4.1 模型,是在 Claude Opus 4 的基础上开发的,后者是在今年 5 月底发布的。可以看出,Anthropic 在模型更新上的速度真的是相当快。Claude Opus 4.1 在智能体任务、真实世界编程和推理能力上都有明显提升,支持大约 200K 的上下文窗口。
不管是商业用户还是个人用户,Claude Opus 4.1 现在都已经向 Claude Pro、Max、Team 和企业用户开放了。
Claude Opus 4.1:开发者的新助力
说到开发者们,Claude Opus 4.1可是一个不错的选择,适用于以下几个平台哦:
- Anthropic API
- Amazon Bedrock
- Google Cloud 的 Vertex AI
而且呢,Claude Opus 4.1 现在也已经结合进 Claude Code 里了,真是方便!
提到价格,Claude Opus 4.1的收费标准是:
- 输入 token 每百万 15 美元
- 输出 token 每百万 75 美元
如果你开启了提示缓存功能,最多可以节省 90% 的费用,使用批处理还可以节省最多 50% 的开支,简直太划算了!

想了解更多定价信息,可以访问:定价链接
在性能方面,Opus 4.1在SWE-bench Verified基准测试中表现优异,达到了74.5%。此外,这个模型在深度研究和数据分析方面的能力也得到了明显提升,特别是在细节跟踪和智能体搜索方面。

根据GitHub的评估,Claude Opus 4.1在许多方面都比Opus 4有所进步,尤其是在多文件代码重构方面,表现得相当突出。
对于企业用户来说,Rakuten Group发现,Opus 4.1在处理大型代码库时,能准确找到需要修改的部分,避免了不必要的更改和新bug的出现。这种精准让他们团队在日常调试中更加愿意使用它。
还有其他企业用户提到,在他们的初级开发者评估中,Opus 4.1相比于Opus 4的进步是相当显著的,性能提升类似于Sonnet 3.7升级到Sonnet 4时的飞跃。

Anthropic 强烈建议大家把 Opus 4 升级到 Opus 4.1,只需在 API 中使用 claude-opus-4-1-20250805 就能轻松接入新模型哦。
使用场景
Claude Opus 4.1 采用了混合推理模式,既能给出快速回复,又能展示推理的过程,API 用户还可以细致地控制思维预算,达到成本和性能的最佳平衡。
它的应用场景可真不少,举几个例子:
高级编程能力:Claude Opus 4.1 在 SWE-bench 基准测试中表现优异,能够完成那些耗时好几天的工程任务,且在上千步的操作中保持连贯和上下文意识。特别是它更好的代码风格理解和支持32K的输出 token,让它在大规模代码生成和重构项目中大显身手。
智能体搜索与研究:Claude Opus 4.1 能够高效地从外部和内部数据源中检索信息,在复杂环境中综合出全面的见解。它在智能体搜索任务中的表现相当出色,可以进行数小时的自主研究,同时分析各种资料,比如专利数据库、学术论文和市场报告,为决策提供深入的战略性洞察。
总之,随着新模型的推出,Anthropic 还发布了系统卡,有兴趣的朋友可以去看看哦。

详情地址在这:https://assets.anthropic.com/m/4c024b86c698d3d4/original/Claude-4-1-System-Card.pdf
大家也都期待着新模型能帮我们解决一些棘手问题。

不过,面对那高得离谱的订阅费,大家也不禁感慨:真是太贵了,买不起啊。
新模型的价格真让人咋舌!
“这消耗的token可真不少。”
对了,关于谷歌的AI国际象棋比赛,第一天Claude Opus 4可惜输给了Gemini 2.5 Pro。如果Claude Opus 4.1参赛,结果会不会有所不同呢?
