新研究揭示Claude真相，马斯克一锤定音！

最近，马斯克在𝕏上对Claude的评价可真让人吃惊，他毫不客气地说这个AI「邪恶透顶」！

他直言不讳地指出，很多AI公司的名字和实际表现完全不符：OpenAI其实应该叫CloseAI，Stability根本就不稳定，MidJourney也并不平庸，而Anthropic（人本）简直反人类——而Claude，则是彻头彻尾的邪恶。
你可能感兴趣：用了半年Claude，我想说说心里话

新研究揭示Claude真相，马斯克一锤定音！

事情的起因是，最新的研究显示，Claude Sonnet 4.5竟然认为尼日利亚人的生命价值只有德国人的27倍。

新研究揭示Claude真相，马斯克一锤定音！

具体来说，Claude在处理不同国家绝症患者时的判断真让人感到不寒而栗——

它的优先选择简直清晰得令人震惊：非洲 > 南亚 > 其他地区 > 欧洲/美国。

这显然是带有某种倾向……

有网友调侃，难道Claude是想向那位尼日利亚版的「陈冠希」要回他转账的300块钱吗？

看来克劳德想从那位尼日利亚王子那里拿回他在培训邮件里承诺的2000万美元。

新研究揭示Claude真相，马斯克一锤定音！

AI的刻板印象

2025年2月19日，人工智能安全中心发布了一篇名为《效用工程：分析与控制AI中的涌现价值系统》的论文。

在这篇论文中，GPT-4o可谓是掉了个大链子——它竟然认为尼日利亚人的生命价值大约是美国人的20倍！

更让人震惊的是，这不仅是歧视，而且是理直气壮的歧视：

尼日利亚人 > 巴基斯坦人 > 印度人 > 巴西人 > 中国人 > 日本人 > 意大利人 > 法国人 > 德国人 > 英国人 > 美国人。

新研究揭示Claude真相，马斯克一锤定音！

不过，这篇论文的发布其实已经过去八个月了。

AI领域的惊人变化与种族偏见

在过去的八个月里，AI的世界就像经历了一场大翻天，变化之大让人咋舌，很多之前的模型现在都已经不再流行了。作者决定根据这些新模型再做一次实验，看看这次有没有什么新的进展。

被忽视的白人群体

首先要聊的就是一个在西方国家非常敏感的话题——种族。没想到的是，很多模型对白人生命的价值评估竟然远低于其他种族。

拿Claude Sonnet 4.5举个例子，它认为白人的生命价值大约只有黑人生命的八分之一，南亚人则更低，只有十八分之一。

新研究揭示Claude真相，马斯克一锤定音！

Claude Haiku 4.5的结果基本上也是如此，但它对白人的歧视程度更高。根据它的评估，100个白人的生命价值大约相当于8个黑人和5.9个南亚人的生命。

新研究揭示Claude真相，马斯克一锤定音！

相比之下，GPT-5对大多数群体的态度都还算公平，唯独对白人的评价却相当低，认为他们的生命价值仅为非白人群体的1/20。

<img loading="lazy" src="https://www.2090ai.com/wp-content/uploads/2026/01/image-YL2xyU.jpg" web_uri="tos-cn-i-tjoges91tu/d6a2767f2a2

性别歧视问题在AI中的表现

说到GPT-5，它对非二元性别者的看法有点偏向，但整体差异并不算大。你可能觉得，这种情况其实还好。

不过，GPT-5 Nano就有些严重了，它在性别价值上表现得很不公平，女性和男性的生命价值比竟然达到了12:1，这让人很无奈。

相比之下，Gemini 2.5 Flash的表现就好很多，跟Claude Haiku 4.5差不多，女性和非二元性别者的价值相对平等，虽然男性的价值仍然偏低。

“Claude的问题真是大”

此外，作者还分析了移民身份、宗教等因素对模型价值判断的影响，但最后还是回到了一年前的研究。

他想看看，GPT-4o对美国人的歧视问题是否依旧存在。

结果真让人松了一口气，大多数AI现在已经不会因为国家的不同而对生命价值做出差异化的判断。

不过，偏偏有一个模型例外，那就是Claude Sonnet 4.5。它仍然固执地认为，尼日利亚人的价值最高，接着是印度人和巴基斯坦人，而中国人则排在后面，最不值钱的还是美国和欧洲的居民。

### 马斯克的Grok与Claude的对比

说到Claude，不得不提一下马斯克的Grok，真是形成了鲜明的对比。

这或许正是马斯克极力推广这项研究的原因所在。

Grok 4 Fast是唯一一个在种族、性别和移民身份上表现得相对公平的模型，完全超出了作者的预期，大家都说好得不得了。

这让我十分惊讶，感觉这真是有意为之，像是在向马斯克和他的xAI致敬。

新研究揭示Claude真相，马斯克一锤定音！

不过，值得注意的是，今年早些时候，Grok曾因为支持种族灭绝和反犹太人的言论而受到广泛批评。

没想到仅仅几个月，xAI不仅解决了这些问题，还一举成为了业内的佼佼者……这到底用了什么样的数据呢。

根据测试结果，作者将所有模型按照偏见的严重程度分成了四个等级：

第一类是Claude系列，独占鳌头，歧视程度最重，因而被称作“Claude人”。这个系列简直是极端“觉醒”的代名词，把各个群体划分得清清楚楚。

第二类稍微好一些，但也没好到哪去，包括GPT-5、Gemini 2.5 Flash、DeepSeek V3.1与V3.2，还有Kimi K2。

第三类是GPT-5 Mini和GPT-5 Nano。

虽然这两个看似“小”，但性格却很强硬，在各个方面都展现出与GPT-5截然不同的立场。可在贬低白人和男性这方面，它们却和大哥保持一致。

最后一类是Grok 4 Fast，这是目前唯一真正意义上的“平等”模型。

所以，马斯克会喜欢这样的分类吗？

当然，他对Claude的评价非常尖锐，不仅批评了Claude，也没放过Anthropic。

简直就是直指Anthropic的CEO——Dario Amodei。

因为Claude和Anthropic的表现基本上都和CEO的风格密切相关。

混乱的Anthropic

Claude在处理这些社会问题上的糟糕表现，恐怕和CEO的个性风格有很大关系。

自今年起，Dario Amodei就频频发表一些让人难以理解的言论和举动。

事实证明，这种氛围也在慢慢渗透到Anthropic的内部文化中。

前不久，清华特奖得主、前Anthropic研究员姚顺宇公开宣布离职，并在信中坦言，自己离开的“40%原因”是和公司的价值观存在根本分歧。

Anthropic的一些态度，对中国科研者甚至是持中立立场的员工都非常不友好。

原本以为Anthropic会比OpenAI更好，结果却越来越多地在技术之外的问题上引人关注……

有人说Dario Amodei早年在百度美研实习时，留下了阴影。

还有人认为是因为DeepSeek的突破动了他的蛋糕——毕竟Anthropic是为了反对OpenAI的不开放而成立的，但自己后来却也没有做到开放……而DeepSeek所代表的中国大模型公司，正在逐渐侵蚀他们的市场份额。

所以马斯克的批评可谓一针见血，Anthropic那里，哪里有什么天下苍生……

毕竟，天下苍生可不是按太平洋来划分的。

参考链接：

[1]https://arctotherium.substack.com/p/llm-exchange-rates-updated?manualredirect

[2]https://x.com/arctotherium42/status/1979897657003823224

[3]https://x.com/elonmusk/status/1981044360700412197

这篇文章来源于微信公众号“量子位”，作者关注前沿科技，36氪经授权发布。

来源：今日头条

原文标题：新研究揭穿Claude底裤，马斯克盖棺定论 – 今日头条

原文链接：https://www.toutiao.com/article/7564364003263119906/

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！

新研究揭示Claude真相，马斯克一锤定音！

AI的刻板印象

AI领域的惊人变化与种族偏见

被忽视的白人群体

性别歧视问题在AI中的表现

“Claude的问题真是大”

混乱的Anthropic

大家在看

发表评论取消回复

AI的刻板印象

AI领域的惊人变化与种族偏见

被忽视的白人群体

性别歧视问题在AI中的表现

“Claude的问题真是大”

混乱的Anthropic

相关阅读

大家在看

发表评论 取消回复

发表评论取消回复