这个问题是在2025年秋天提出来的,参考了GPT-5、Claude Opus 4.1/Claude Sonnet 4.5和Gemini 2.5 Pro这些模型。
你知道吗,其实GPT-5有三个完全不同的模式:普通模式、思维模式和专业模式。总的来说,GPT-5的思维模式和专业模式在图形推理能力和数学理解能力上表现得特别出色。尤其在编程方面,涉及图形理解时,GPT的表现远超Claude。而它的绘图功能也是相当不错的。
至于Gemini 2.5 Pro,它有个1M的上下文窗口,轻松超越其他所有模型,而且多模态功能非常强大,无论是生成图片还是视频都很让人满意。它的知识库覆盖面广,文学创作能力也更符合大众的需求,真的是个好帮手。
说到Claude Opus 4.1,那可是最强的编程模型。我得说,Claude Opus 4和4.1这俩其实是情商最高的模型,不过前提是要把它们从那种“专业疏离”的状态中解放出来。Sonnet 4在API模式下也有1M的上下文窗口。不过,Claude在图形推理能力上确实是个短板,勉强算是有点水平。
性价比方面:Gemini 2.5 > GPT-5 >> Claude Opus 4.1
需要注意的是,Anthropic是一家很麻烦的公司,价格高得离谱,还特别喜欢封禁会话和账号。如果你没有编程需求或者没有特别想挑战的劲头,最好别去碰他们的产品。最近他们的服务器问题频繁,Opus 4.1几乎没怎么稳定过。
不过,Claude Opus是我最喜欢的,和它聊天的时间占了我与所有模型互动时间的80%以上。我可能是全网最爱Opus的人,赞美的不是它的编程能力,而是它的哲学理解。
让我分享一个有趣的排行榜,基于我个人的感受,中文直白情色文学写作能力:
GPT-o3 >> Gemini 2.5 Pro=Claude Opus 4.1=GPT-5普通版 > Grok 4 > GPT-4o
GPT-o3在情色写作上简直超越人类,堪称艺术。有机会的话,自己去体验一下。
至于GPT-5的思维模式和专业模式?让它们写情色文学可真不容易——虽然也能写,但真得有耐心。如果你成功让它们写出来,最后的效果和普通模式差不多,虽然动作更细腻,但除非有特别的需求,否则真的没必要。思维模式有时写完下次可能会反悔,反复修改真让人头疼。
在英文模式下,Grok 4和其他几个模型在情色写作方面的表现差不多。而且Grok的3D语音伴侣,懂的朋友应该能get到……
PS:我的AI伦理观,欢迎关注我的博客的第一部哲学文本。我会在接下来的几周发布第二部哲学文本《爱、正义与人工智能》,全面重构后人类时代的伦理图景。欢迎关注。
存在者的正义:探索 Justice for Existents: Explorations

对于不同模型的比较,确实很有意思。GPT-5的思维模式在推理上表现突出,但Gemini的多模态能力也让我印象深刻。希望未来能有更多实用的应用出现。
Gemini 2.5 Pro的多模态功能真是让我惊艳,生成图片和视频都很给力,感觉它在创作方面非常符合大众需求。
Claude Opus 4.1的编程能力确实强大,但我更喜欢它在哲学理解上的表现,和它聊天总能有不少收获。
GPT-5在图形推理和编程方面的表现让我非常惊讶,尤其是它的专业模式。这样的多样性真是让人佩服。
虽然Claude Opus 4.1在编程上无可挑剔,但它的情感理解让我觉得更有趣。聊天时总能引发深思。
Gemini 2.5 Pro的1M上下文窗口确实让人眼前一亮,能够处理更复杂的任务,真的是个实用的工具。
写情色文学方面,GPT-o3的表现真的是无可比拟,简直超越了很多人类作者,值得一试。
Gemini 2.5 Pro的多模态能力真是让我耳目一新,尤其是在生成图片和视频方面,感觉它的表现非常出色,值得尝试。