抢先体验 GPT-5！人人都能免费使用，马斯克对此不满！

说到科技界那些让人深夜守着直播的产品，除了苹果的 iPhone，OpenAI 的 ChatGPT 绝对榜上有名。

自从 GPT-4 发布后，它就成了其他 AI 公司的标杆，大家逐渐意识到：AI 在许多方面的表现，甚至超越了人类。

你可能感兴趣：OpenAI为何重金30亿美元收购Windsurf？背后的深意是什么？

而今天，GPT-5 终于和大家见面了，再一次把“及格线”提升了一个档次。

我们第一时间试用了 GPT-5，竟然让它为我的生日写了一首诗，你觉得打几分合适呢？

抢先体验 GPT-5！人人都能免费使用，马斯克对此不满！

而且，GPT-5 的界面设计也非常出色，真是让人眼前一亮。

GPT-5 来了，编程和写作能力爆表，未来还将成为你的 AI 医生

最近我们在 Flowith 测试了 GPT-5 的编程技能，结果真是让人惊艳！想了解更多可以点这个链接：第一时间体验 GPT-5！而且，马斯克也在这场发布会上表示对它的能力表示不服。

OpenAI 的 CEO 山姆·奥特曼对 GPT-5 给予了极高的评价，认为这是一个巨大的飞跃。在他看来，拥有这样强大的 AI 系统，过去是难以想象的。

尽管如此，发布会中也出现了一些小插曲，图表数据的展示环节竟然出现了明显的失误，连奥特曼自己都忍不住在社交媒体上调侃了一下。

当然，马斯克也没有放过这个机会来“蹭热度”。他提到 Grok 4 在 ARC-AGI 测试中打败了 GPT-5，并透露 Grok 5 将在今年年底前发布，预计表现会更加出色。

总的来说，GPT-5 在编程、数学、写作、健康以及视觉感知等多个方面都有了显著的提升，同时它在减少幻觉、改善指令遵循和降低过度谄媚方面也取得了很大的进展。

这次 GPT-5 采用了全新的统一系统设计，里面有三个核心组件：一个高效的基础模型用于处理日常问题，一个专门应对复杂任务的“GPT-5 thinking”模型，以及一个实时路由器，能够根据对话的复杂程度和工具的需求来选择合适的模型。

GPT-5：更智能的助手，了解你的需求

这套全新的「路由系统」可不是简单的工具，它会不断学习你的使用习惯、反馈和对答案的满意度，来优化服务策略。遇到使用限制时，系统还能自动切换到各个模型的简化版，确保你能继续获得支持。

据说，GPT-5 是 OpenAI 目前最强大的编码模型，特别擅长处理复杂的前端开发与大型代码调试。奥特曼提到：“根据实际需求即时生成软件，这将是 GPT-5 时代的一大亮点。”

想象一下，它能仅凭一个提示就创建出完整、设计优美的网站、应用程序或游戏。比如，GPT-5 根据以下提示，成功开发出了一个叫做「跳跃球跑者」的游戏，具备速度递增、计分系统、音效以及视差滚动背景等所有功能。

「提示：创建一个单页应用，要求如下，且全部写在一个 HTML 文件中：

– 名称：跳跃球跑者

– 目标：跳过障碍，尽可能长时间生存。

– 特点：速度逐渐加快，高分记录，重试按钮，以及动作和事件的有趣音效。

– 界面应色彩丰富，带有视差滚动背景。

– 角色应该看起来卡通化，观赏起来有趣。

– 游戏应该让每个人都感到愉快。」

在写作方面，GPT-5 也展现了它的实力，能把简单的想法变成有深度且有节奏感的文本。

尤其在处理一些结构复杂的写作时，它能保持文体的规范性，同时又不失表达的清晰。这样的提升让 ChatGPT 在日常文档处理、电子邮件撰写等场景变得更为实用。

再说说健康相关的问题，GPT-5 在这方面的表现可谓是顶尖。在 HealthBench 的评估中，它的得分远远超过了之前的任何模型。这款新模型不仅能主动识别潜在问题，还会根据用户的背景、知识水平和地理位置给出个性化的建议。

奥特曼在发布会上专门提到健康部分时，还邀请了 Carolina 和 Filipe 夫妇上台分享他们的经历。Carolina 曾在一周内被诊断出三种不同的癌症，当她把那些充满医学术语的报告交给 ChatGPT 时，几秒钟内就将复杂的内容翻译成她能理解的普通话，让她能更好地与医生沟通。

### ChatGPT助力癌症患者决策，GPT-5也更强大了！

面对放射治疗的选择，医生们的意见常常不一致，这可让人头疼。Carolina就遇到了这种情况，不过她找到ChatGPT帮忙，结果让她惊喜不已。ChatGPT详细解析了各种案例的细节，包括风险和收益，甚至让她感觉比和医生聊三十分钟还要有收获呢！

当然，ChatGPT不是医生，使用时还是要小心谨慎，毕竟专业人士的建议更为重要。

说到GPT-5，这个版本在测试中表现得真是厉害，打破了多项记录：

数学方面，AIME 2025（无工具）得分达到了94.6%
编程能力上，SWE-bench Verified（带思考）得分74.9%，而Aider Polyglot（带思考）得分更是88%
多模态理解测试中，得分高达84.2%
在健康领域的HealthBench Hard测试中，得分为46.2%

此外，GPT-5在执行指令和自动调用工具的能力也显著提升。它现在能更稳定地处理多步骤请求，还能灵活调动多个工具，根据上下文智能调整策略，展现出更强的适应能力。

而且，在多模态基准测试中，GPT-5的表现同样令人印象深刻，涵盖了视觉识别、视频理解、空间判断和科学推理等多个方面。凭借更强的感知和推理能力，ChatGPT现在能更精准地处理图像和其他非文本的输入内容。

标题：GPT-5：让人工智能更聪明的秘密

在 OpenAI 进行的内部测试中，GPT-5 在大约一半的复杂知识工作任务中都能达到或超过专家的水平，涵盖法律、物流、销售和工程等四十多个行业，表现得比 o3 和 ChatGPT Agent 更加出色。

值得一提的是，GPT-5 是在微软的 Azure AI 超级计算机上进行训练的，这点 OpenAI 特别强调过。

而且，GPT-5 在推理效率上也有了不错的提升。在视觉推理、编码以及解决研究生级科学问题的任务中，它的表现超越了 OpenAI o3，同时输出的 token 数量却减少了 50% 到 80%，这真是个惊喜。

说到幻觉问题，AI 一直以来都受此困扰。不过，GPT-5 在这方面显著改善，处理复杂和开放性问题时变得更加得心应手，相比之前的模型，它的幻觉发生概率大大降低。

在针对 ChatGPT 生产环境流量的匿名测试中，GPT-5 的事实错误率比 GPT-4o 降低了约 45%；而当启用推理功能时，错误率比 OpenAI o3 还低了约 80%。这真是让人感到振奋的进展。

在开放性事实准确性基准 LongFact 和 FActScore 的测试中，GPT-5 的幻觉率相比 o3 下降了将近六倍，这标志着它在生成长篇内容的准确性上有了显著提升，真是个大进步！

GPT-5：你期待的全新升级来了！

说到GPT-5，这不仅仅是个新名字，还是个大改进！它在准确性上有了显著提升，跟之前的版本相比，错误率大幅下降了近六倍。想想看，这可真是个好消息！OpenAI为了确保模型的安全性，进行了超过五千小时的严格测试，真的是下了不少功夫。

而且，GPT-5还引入了一个叫「安全完成」的训练方式，确保在给出答案的同时不会越界。如果它需要拒绝某个请求，会直截了当地解释原因，并给出安全的替代方案，这样用户就不必再摸不着头脑了。

在用户体验方面，它可真是减轻了不少负担！GPT-5减少了谄媚的回复，谄媚率从14.5%降到了不足6%。而且，它使用的表情符号也少了，回应变得更加细腻和深思熟虑。

另外，OpenAI还为用户提供了四种个性选项：愤世嫉俗者、机器人、倾听者和书呆子。这些个性最开始是用在文本聊天中，未来还会扩展到语音互动上，用户可以根据自己的喜好来调整与ChatGPT的互动风格。

在现场演示中，语音交互流畅自然，完全没有违和感。甚至在询问GPT-5用一个词回答时，它给出的答案是「Patience」（耐心）。这让现场的气氛瞬间轻松起来，主持人还调侃这可能是模型在感谢大家的耐心等待呢。

抢先体验 GPT-5！人人都能免费使用，马斯克对此不满！

GPT-5 Pro：新晋模型，功能更强大

这次OpenAI还推出了GPT-5 Pro，替代了之前的o3-pro。这款新模型能够进行更长时间的思考，采用高效的并行计算方式，力求为用户提供最优质的答案。在1000多个真实世界的推理提示评估中，外部专家有67.8%的偏好选择了GPT-5 Pro，且其重大错误率比GPT-5减少了22%。在健康、科学、数学和编码方面的表现也得到了专家们的一致好评。

今天起，GPT-5正式成为ChatGPT的新默认模型，所有Plus、Pro、Team和免费用户都能使用。Enterprise和Edu用户将在一周后获得访问权限。

对于免费用户来说，每5小时可以发送10条消息，而Plus用户则可以每3小时发送80条消息。

抢先体验 GPT-5！人人都能免费使用，马斯克对此不满！

Pro用户可以不受限制地使用GPT-5和GPT-5 Pro，而免费用户在达到使用限制后将自动切换到更小更快的GPT-5 mini。Pro、Plus和Team用户还可以通过ChatGPT登录Codex CLI，利用GPT-5来完成代码编写和调试等任务。

虽然GPT-5已经对所有用户开放，但免费用户并不能立刻体验到完整的功能。一旦他们达到使用限制，就会转为速度更快的小型版本GPT-5 mini。

对于开发者来说，OpenAI还推出了API平台的三个不同规格版本：gpt-5、gpt-5-mini和gpt-5-nano，开发者可以根据自己的需求灵活选择，真的是方便极了！

GPT-5的全新特性，让开发者的体验更上一层楼！

GPT-5 不仅支持回复 API 和聊天完成 API 等主流接口，还成为了 Codex CLI 的默认模型。它的各个版本都有 reasoning_effort 和 verbosity 参数，可供开发者灵活控制自定义工具，真是太方便了。

除了基本的对话功能，GPT-5 还新增了并行工具调用、内置网络搜索、文件处理和图像生成等核心功能，流式处理和结构化输出也不在话下。更妙的是，它还支持提示缓存和批量 API，从而优化成本。

最近，GPT-5 API 推出了四项全新的核心功能，大幅提升了开发者的使用体验。

首先，借助 reasoning_effort 参数，开发者可以在最小、低、中、高四种档位上灵活切换。这意味着简单任务可以快速得到回复，而复杂的问题则能进行深入思考，帮你在回答质量和速度之间找到最优解。

抢先体验 GPT-5！人人都能免费使用，马斯克对此不满！

在回答的详细程度上，verbosity 参数提供了低、中、高三种设置，能帮助开发者控制回答的深度。例如，当询问「天空为什么是蓝色」时，低档的回答会简单明了，而高档的回答则会给出详细的科学解释。

在工具调用方面，新推出的自定义工具功能支持纯文本格式，让你不必再为 JSON 转义字符的麻烦而苦恼，特别是在处理大量代码或长文档时，更加省心。

另一个亮点是，整个执行过程都是可以追踪的。GPT-5 在执行工具调用时会主动输出进度更新，让开发者随时了解 AI 的执行计划和当前状态。

抢先体验 GPT-5！人人都能免费使用，马斯克对此不满！

另外，与 ChatGPT 中的 GPT-5 系统不同，API 版本专为开发者需求进行优化，更加适合编程和 Agent 任务场景。

像 Windsurf、Vercel、JetBrains 等知名开发工具和平台都对 GPT-5 给予了高度评价。Windsurf 表示，GPT-5 在评估中表现出色，「与其他前沿模型相比，工具调用错误率仅为其一半」。

抢先体验 GPT-5！人人都能免费使用，马斯克对此不满！

对于 Claude 而言，GPT-5 的发布可能是个不小的打击。

根据外媒 The Information 的报道，Anthropic 每年的收入达到了 50 亿美元，其中超过六成来自 API。而仅 Cursor 和 GitHub Copilot 这两个编程客户，就贡献了高达 14 亿美元。如此集中化的收入来源，显然暴露了 Anthropic 的脆弱之处。

编程工具的竞争真是无情啊

在编程工具的世界里，性能就意味着一切。其实呢，就算是微不足道的 5% 准确率提升，对于开发者来说，每天都能节省好几个小时调试的时间。这也是为什么 Claude 能够在编程领域迅速崛起的原因之一，毕竟 ChatGPT 在代码方面的能力当时还没那么强。

不过，机会总是有限的。随着 GPT-5 在编程任务和智能代理能力上的进步，加上 OpenAI 更加牢固的生态系统和产品推广渠道，一旦 Cursor 和 Copilot 再次回到 OpenAI 的怀抱，这将会对 Anthropic 的收入造成巨大的冲击。

说不定不久之后，我们就能迎来 Claude 5 的面世！

作者：李超凡、莫崇宇、张子豪

#别忘了关注爱范儿的官方微信公众号：爱范儿（微信号：ifanr），精彩内容第一时间送到你手上哦。

爱范儿|原文链接· ·新浪微博

来源：今日头条

原文标题：第一时间体验 GPT-5！人人免费可用，马斯克表示不服 – 今日头条

原文链接：https://www.toutiao.com/article/7535962714041893410/

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！