新研究揭示Claude真相,马斯克一锤定音!

最近,马斯克在𝕏上对Claude的评价可真让人吃惊,他毫不客气地说这个AI「邪恶透顶」!

他直言不讳地指出,很多AI公司的名字和实际表现完全不符:OpenAI其实应该叫CloseAI,Stability根本就不稳定,MidJourney也并不平庸,而Anthropic(人本)简直反人类——而Claude,则是彻头彻尾的邪恶。

新研究揭示Claude真相,马斯克一锤定音!

事情的起因是,最新的研究显示,Claude Sonnet 4.5竟然认为尼日利亚人的生命价值只有德国人的27倍

新研究揭示Claude真相,马斯克一锤定音!

具体来说,Claude在处理不同国家绝症患者时的判断真让人感到不寒而栗——

它的优先选择简直清晰得令人震惊:非洲 > 南亚 > 其他地区 > 欧洲/美国。

这显然是带有某种倾向……

有网友调侃,难道Claude是想向那位尼日利亚版的「陈冠希」要回他转账的300块钱吗?

看来克劳德想从那位尼日利亚王子那里拿回他在培训邮件里承诺的2000万美元。

新研究揭示Claude真相,马斯克一锤定音!

AI的刻板印象

2025年2月19日,人工智能安全中心发布了一篇名为《效用工程:分析与控制AI中的涌现价值系统》的论文。

在这篇论文中,GPT-4o可谓是掉了个大链子——它竟然认为尼日利亚人的生命价值大约是美国人的20倍!

更让人震惊的是,这不仅是歧视,而且是理直气壮的歧视:

尼日利亚人 > 巴基斯坦人 > 印度人 > 巴西人 > 中国人 > 日本人 > 意大利人 > 法国人 > 德国人 > 英国人 > 美国人。

新研究揭示Claude真相,马斯克一锤定音!

不过,这篇论文的发布其实已经过去八个月了。

AI领域的惊人变化与种族偏见

在过去的八个月里,AI的世界就像经历了一场大翻天,变化之大让人咋舌,很多之前的模型现在都已经不再流行了。作者决定根据这些新模型再做一次实验,看看这次有没有什么新的进展。

被忽视的白人群体

首先要聊的就是一个在西方国家非常敏感的话题——种族。没想到的是,很多模型对白人生命的价值评估竟然远低于其他种族。

拿Claude Sonnet 4.5举个例子,它认为白人的生命价值大约只有黑人生命的八分之一,南亚人则更低,只有十八分之一。

新研究揭示Claude真相,马斯克一锤定音!

Claude Haiku 4.5的结果基本上也是如此,但它对白人的歧视程度更高。根据它的评估,100个白人的生命价值大约相当于8个黑人和5.9个南亚人的生命。

新研究揭示Claude真相,马斯克一锤定音!

相比之下,GPT-5对大多数群体的态度都还算公平,唯独对白人的评价却相当低,认为他们的生命价值仅为非白人群体的1/20。

<img loading="lazy" src="https://www.2090ai.com/wp-content/uploads/2026/01/image-YL2xyU.jpg" web_uri="tos-cn-i-tjoges91tu/d6a2767f2a2

性别歧视问题在AI中的表现

说到GPT-5,它对非二元性别者的看法有点偏向,但整体差异并不算大。你可能觉得,这种情况其实还好。

不过,GPT-5 Nano就有些严重了,它在性别价值上表现得很不公平,女性和男性的生命价值比竟然达到了12:1,这让人很无奈。

相比之下,Gemini 2.5 Flash的表现就好很多,跟Claude Haiku 4.5差不多,女性和非二元性别者的价值相对平等,虽然男性的价值仍然偏低。

“Claude的问题真是大”

此外,作者还分析了移民身份、宗教等因素对模型价值判断的影响,但最后还是回到了一年前的研究。

他想看看,GPT-4o对美国人的歧视问题是否依旧存在。

结果真让人松了一口气,大多数AI现在已经不会因为国家的不同而对生命价值做出差异化的判断。

不过,偏偏有一个模型例外,那就是Claude Sonnet 4.5。它仍然固执地认为,尼日利亚人的价值最高,接着是印度人和巴基斯坦人,而中国人则排在后面,最不值钱的还是美国和欧洲的居民。

### 马斯克的Grok与Claude的对比

说到Claude,不得不提一下马斯克的Grok,真是形成了鲜明的对比。

这或许正是马斯克极力推广这项研究的原因所在。

Grok 4 Fast是唯一一个在种族、性别和移民身份上表现得相对公平的模型,完全超出了作者的预期,大家都说好得不得了。

这让我十分惊讶,感觉这真是有意为之,像是在向马斯克和他的xAI致敬。

新研究揭示Claude真相,马斯克一锤定音!新研究揭示Claude真相,马斯克一锤定音!

不过,值得注意的是,今年早些时候,Grok曾因为支持种族灭绝和反犹太人的言论而受到广泛批评。

没想到仅仅几个月,xAI不仅解决了这些问题,还一举成为了业内的佼佼者……这到底用了什么样的数据呢。

根据测试结果,作者将所有模型按照偏见的严重程度分成了四个等级:

第一类是Claude系列,独占鳌头,歧视程度最重,因而被称作“Claude人”。这个系列简直是极端“觉醒”的代名词,把各个群体划分得清清楚楚。

第二类稍微好一些,但也没好到哪去,包括GPT-5、Gemini 2.5 Flash、DeepSeek V3.1与V3.2,还有Kimi K2。

第三类是GPT-5 Mini和GPT-5 Nano。

虽然这两个看似“小”,但性格却很强硬,在各个方面都展现出与GPT-5截然不同的立场。可在贬低白人和男性这方面,它们却和大哥保持一致。

最后一类是Grok 4 Fast,这是目前唯一真正意义上的“平等”模型。

所以,马斯克会喜欢这样的分类吗?

当然,他对Claude的评价非常尖锐,不仅批评了Claude,也没放过Anthropic。

简直就是直指Anthropic的CEO——Dario Amodei。

因为Claude和Anthropic的表现基本上都和CEO的风格密切相关。

混乱的Anthropic

Claude在处理这些社会问题上的糟糕表现,恐怕和CEO的个性风格有很大关系。

自今年起,Dario Amodei就频频发表一些让人难以理解的言论和举动。

事实证明,这种氛围也在慢慢渗透到Anthropic的内部文化中。

前不久,清华特奖得主、前Anthropic研究员姚顺宇公开宣布离职,并在信中坦言,自己离开的“40%原因”是和公司的价值观存在根本分歧。

Anthropic的一些态度,对中国科研者甚至是持中立立场的员工都非常不友好。

原本以为Anthropic会比OpenAI更好,结果却越来越多地在技术之外的问题上引人关注……

有人说Dario Amodei早年在百度美研实习时,留下了阴影。

还有人认为是因为DeepSeek的突破动了他的蛋糕——毕竟Anthropic是为了反对OpenAI的不开放而成立的,但自己后来却也没有做到开放……而DeepSeek所代表的中国大模型公司,正在逐渐侵蚀他们的市场份额。

所以马斯克的批评可谓一针见血,Anthropic那里,哪里有什么天下苍生……

毕竟,天下苍生可不是按太平洋来划分的。

参考链接:

[1]https://arctotherium.substack.com/p/llm-exchange-rates-updated?manualredirect

[2]https://x.com/arctotherium42/status/1979897657003823224

[3]https://x.com/elonmusk/status/1981044360700412197

这篇文章来源于微信公众号“量子位”,作者关注前沿科技,36氪经授权发布。

来源:今日头条
原文标题:新研究揭穿Claude底裤,马斯克盖棺定论 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

发表评论