Claude崩盘:Opus 4.1白天性能下降,Anthropic坦承并撤回更新

闻乐 发自 凹非寺

量子位 | 公众号 QbitAI

刚发布的Claude Opus 4.1却不幸翻车了。

好几位用户都反映Claude Opus 4.1变得特别慢,官方也不得不承认,确实在处理某些请求时质量出现了下降。

Claude崩盘:Opus 4.1白天性能下降,Anthropic坦承并撤回更新

那到底Claude Opus 4.1出什么问题了呢?

Claude Opus 4.1白天推理性能下降

其实在Anthropic发声明的前几天,就已经有用户吐槽说:Claude Opus 4.1在早上10点到11点的表现真是糟糕透了。

这个模型的表现差得就像换了个人,处理文稿时出现了不少错误。不过奇怪的是,这种质量下滑到了凌晨就完全消失了

Claude崩盘:Opus 4.1白天性能下降,Anthropic坦承并撤回更新

有些人猜测,Claude Opus 4.1在白天表现不佳的原因,可能与它采用的1.58位量化有关。

这种量化方法的主要问题就是,它会对模型的精确度产生较大影响。

量化实际上是把模型的参数从标准的16位浮点(FP16)或32位浮点(FP32)压缩到更低的格式,而1.58位量化则更为极端,它仅用 {-1, 0, 1} 三个值来表示参数。

在信息论中,三个值的表示需要 log₂(3)≈1.58496 bits,因此才称其为1.58位量化。

虽然这种方法能减少内存占用,但它很容易让模型失去重要的信息。

比如在Claude Opus 4.1中,如果在白天大量使用1.58位量化来服务用户,模型在应对复杂问题时,智能水平会明显下降,出现代码逻辑分析错误、文案写作逻辑混乱,连一些基本的任务表现也不太理想。

在实际使用中,1.58位量化还可能导致模型的稳定性变差。当参数被限制在仅有的三个值时,面对复杂多变的输入数据,模型的反应能力就会受到限制。

在一些需要精确处理输入数据的场景,比如医学图像分析或金融风险预测,模型可能因为1.58位量化无法准确捕捉到数据特征,进而给出错误的结果,这会对整个系统的稳定性和可靠性造成负面影响。

除了白天性能下滑的问题,官方在使用限制方面的回应也显得不够明确。

有用户反馈,在使用Claude Opus 4.1不到两个小时内,就达到了使用上限。咨询客服时,得到的回复一会儿说是时间限制,一会儿又说是使用量的问题。

Claude崩盘:Opus 4.1白天性能下降,Anthropic坦承并撤回更新

而且,关于限额的问题,不止一位用户提到过。

用户反馈与官方回应:Claude Opus 4.1的挑战与解决

Claude崩盘:Opus 4.1白天性能下降,Anthropic坦承并撤回更新

有些用户甚至表示,这个模型居然会泄露他们的API密钥。

Claude崩盘:Opus 4.1白天性能下降,Anthropic坦承并撤回更新

面对这种种抱怨,Anthropic的官方反应还算迅速,没让人等太久。

他们坦诚承认,推理堆栈出现了问题,原本是想让模型更高效,没想到反而影响了响应质量。态度真心不错,没有找借口。

而且,他们解决问题的速度也很快,已经把Claude Opus 4.1的版本降回去了,还特别提到Claude Opus 4.0也受到了同样的影响,正在积极处理,考虑问题还是挺全面的。

Claude崩盘:Opus 4.1白天性能下降,Anthropic坦承并撤回更新

一发布声明,就有网友调侃,居然能看到“明星公司”承认自家模型有问题,真是第一次。

Anthropic的态度真不错,网友们怎么看?

Claude崩盘:Opus 4.1白天性能下降,Anthropic坦承并撤回更新

看来,Anthropic的及时认错态度还是得到了很多网友的认可。

不过,作为Claude的用户,你最近有没有觉得Opus 4.1的表现不如以前呢?

参考链接:
[1]https://x.com/TheAhmadOsman/status/1961870729609175088
[2]https://status.anthropic.com/incidents/h26lykctfnsz
[3]https://www.reddit.com/r/Anthropic/comments/1n28ya2/claude_opus_is_all_over_the_place_lately_and_i/

— 完 —

量子位 QbitAI · 头条号签约

关注我们,第一时间获知前沿科技动态

来源:今日头条
原文标题:Claude翻车:Opus 4.1白天退化,Anthropic承认并回滚更新 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《Claude崩盘:Opus 4.1白天性能下降,Anthropic坦承并撤回更新》有8条评论

  1. Claude Opus 4.1的表现真让人失望,白天的性能下降问题很明显,希望Anthropic能够尽快解决。这样的情况影响了用户体验。

    回复
  2. Claude Opus 4.1的白天性能下降真是个意外,看来1.58位量化带来的负面影响不容小觑。希望他们能找到更好的优化方案。

    回复
  3. Claude Opus 4.1的问题暴露出量化方法的风险,白天表现差让人担忧,希望以后能有更稳定的版本推出。

    回复
  4. Claude Opus 4.1白天性能下降的情况让人感到无奈,确实需要对量化方法进行深入的优化,以保证模型在各种时间段的稳定性。

    回复
  5. Claude Opus 4.1白天的性能问题让人感到困扰,尤其是1.58位量化的使用似乎真的影响了模型的准确性,希望后续能有更好的优化。

    回复
  6. Claude Opus 4.1白天的性能下降确实让人失望,1.58位量化的确有很大影响,希望能尽快优化以恢复稳定性。

    回复
  7. Claude Opus 4.1在白天的糟糕表现令人担忧,尤其是1.58位量化似乎让模型失去了准度,希望能尽快找到解决方案。

    回复
  8. Claude Opus 4.1的白天性能下降真让人意外,影响了很多用户体验。希望能尽快解决这个量化带来的问题。

    回复

发表评论