抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!

抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!

说到科技界那些让人深夜守着直播的产品,除了苹果的 iPhone,OpenAI 的 ChatGPT 绝对榜上有名。

自从 GPT-4 发布后,它就成了其他 AI 公司的标杆,大家逐渐意识到:AI 在许多方面的表现,甚至超越了人类。

而今天,GPT-5 终于和大家见面了,再一次把“及格线”提升了一个档次。

我们第一时间试用了 GPT-5,竟然让它为我的生日写了一首诗,你觉得打几分合适呢?

抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!

而且,GPT-5 的界面设计也非常出色,真是让人眼前一亮。

GPT-5 来了,编程和写作能力爆表,未来还将成为你的 AI 医生

最近我们在 Flowith 测试了 GPT-5 的编程技能,结果真是让人惊艳!想了解更多可以点这个链接:第一时间体验 GPT-5!而且,马斯克也在这场发布会上表示对它的能力表示不服。

OpenAI 的 CEO 山姆·奥特曼对 GPT-5 给予了极高的评价,认为这是一个巨大的飞跃。在他看来,拥有这样强大的 AI 系统,过去是难以想象的。

尽管如此,发布会中也出现了一些小插曲,图表数据的展示环节竟然出现了明显的失误,连奥特曼自己都忍不住在社交媒体上调侃了一下。

当然,马斯克也没有放过这个机会来“蹭热度”。他提到 Grok 4 在 ARC-AGI 测试中打败了 GPT-5,并透露 Grok 5 将在今年年底前发布,预计表现会更加出色。

总的来说,GPT-5 在编程、数学、写作、健康以及视觉感知等多个方面都有了显著的提升,同时它在减少幻觉、改善指令遵循和降低过度谄媚方面也取得了很大的进展。

这次 GPT-5 采用了全新的统一系统设计,里面有三个核心组件:一个高效的基础模型用于处理日常问题,一个专门应对复杂任务的“GPT-5 thinking”模型,以及一个实时路由器,能够根据对话的复杂程度和工具的需求来选择合适的模型。

GPT-5:更智能的助手,了解你的需求

这套全新的「路由系统」可不是简单的工具,它会不断学习你的使用习惯、反馈和对答案的满意度,来优化服务策略。遇到使用限制时,系统还能自动切换到各个模型的简化版,确保你能继续获得支持。

据说,GPT-5 是 OpenAI 目前最强大的编码模型,特别擅长处理复杂的前端开发与大型代码调试。奥特曼提到:“根据实际需求即时生成软件,这将是 GPT-5 时代的一大亮点。”

想象一下,它能仅凭一个提示就创建出完整、设计优美的网站、应用程序或游戏。比如,GPT-5 根据以下提示,成功开发出了一个叫做「跳跃球跑者」的游戏,具备速度递增、计分系统、音效以及视差滚动背景等所有功能。

「提示: 创建一个单页应用,要求如下,且全部写在一个 HTML 文件中:

– 名称:跳跃球跑者

– 目标:跳过障碍,尽可能长时间生存。

– 特点:速度逐渐加快,高分记录,重试按钮,以及动作和事件的有趣音效。

– 界面应色彩丰富,带有视差滚动背景。

– 角色应该看起来卡通化,观赏起来有趣。

– 游戏应该让每个人都感到愉快。」

在写作方面,GPT-5 也展现了它的实力,能把简单的想法变成有深度且有节奏感的文本。

尤其在处理一些结构复杂的写作时,它能保持文体的规范性,同时又不失表达的清晰。这样的提升让 ChatGPT 在日常文档处理、电子邮件撰写等场景变得更为实用。

再说说健康相关的问题,GPT-5 在这方面的表现可谓是顶尖。在 HealthBench 的评估中,它的得分远远超过了之前的任何模型。这款新模型不仅能主动识别潜在问题,还会根据用户的背景、知识水平和地理位置给出个性化的建议。

奥特曼在发布会上专门提到健康部分时,还邀请了 Carolina 和 Filipe 夫妇上台分享他们的经历。Carolina 曾在一周内被诊断出三种不同的癌症,当她把那些充满医学术语的报告交给 ChatGPT 时,几秒钟内就将复杂的内容翻译成她能理解的普通话,让她能更好地与医生沟通。

### ChatGPT助力癌症患者决策,GPT-5也更强大了!

面对放射治疗的选择,医生们的意见常常不一致,这可让人头疼。Carolina就遇到了这种情况,不过她找到ChatGPT帮忙,结果让她惊喜不已。ChatGPT详细解析了各种案例的细节,包括风险和收益,甚至让她感觉比和医生聊三十分钟还要有收获呢!

当然,ChatGPT不是医生,使用时还是要小心谨慎,毕竟专业人士的建议更为重要。

说到GPT-5,这个版本在测试中表现得真是厉害,打破了多项记录:

  • 数学方面,AIME 2025(无工具)得分达到了94.6%
  • 编程能力上,SWE-bench Verified(带思考)得分74.9%,而Aider Polyglot(带思考)得分更是88%
  • 多模态理解测试中,得分高达84.2%
  • 在健康领域的HealthBench Hard测试中,得分为46.2%

此外,GPT-5在执行指令和自动调用工具的能力也显著提升。它现在能更稳定地处理多步骤请求,还能灵活调动多个工具,根据上下文智能调整策略,展现出更强的适应能力。

而且,在多模态基准测试中,GPT-5的表现同样令人印象深刻,涵盖了视觉识别、视频理解、空间判断和科学推理等多个方面。凭借更强的感知和推理能力,ChatGPT现在能更精准地处理图像和其他非文本的输入内容。

标题:GPT-5:让人工智能更聪明的秘密

在 OpenAI 进行的内部测试中,GPT-5 在大约一半的复杂知识工作任务中都能达到或超过专家的水平,涵盖法律、物流、销售和工程等四十多个行业,表现得比 o3 和 ChatGPT Agent 更加出色。

值得一提的是,GPT-5 是在微软的 Azure AI 超级计算机上进行训练的,这点 OpenAI 特别强调过。

而且,GPT-5 在推理效率上也有了不错的提升。在视觉推理、编码以及解决研究生级科学问题的任务中,它的表现超越了 OpenAI o3,同时输出的 token 数量却减少了 50% 到 80%,这真是个惊喜。

说到幻觉问题,AI 一直以来都受此困扰。不过,GPT-5 在这方面显著改善,处理复杂和开放性问题时变得更加得心应手,相比之前的模型,它的幻觉发生概率大大降低。

在针对 ChatGPT 生产环境流量的匿名测试中,GPT-5 的事实错误率比 GPT-4o 降低了约 45%;而当启用推理功能时,错误率比 OpenAI o3 还低了约 80%。这真是让人感到振奋的进展。

在开放性事实准确性基准 LongFact 和 FActScore 的测试中,GPT-5 的幻觉率相比 o3 下降了将近六倍,这标志着它在生成长篇内容的准确性上有了显著提升,真是个大进步!

GPT-5:你期待的全新升级来了!

说到GPT-5,这不仅仅是个新名字,还是个大改进!它在准确性上有了显著提升,跟之前的版本相比,错误率大幅下降了近六倍。想想看,这可真是个好消息!OpenAI为了确保模型的安全性,进行了超过五千小时的严格测试,真的是下了不少功夫。

而且,GPT-5还引入了一个叫「安全完成」的训练方式,确保在给出答案的同时不会越界。如果它需要拒绝某个请求,会直截了当地解释原因,并给出安全的替代方案,这样用户就不必再摸不着头脑了。

在用户体验方面,它可真是减轻了不少负担!GPT-5减少了谄媚的回复,谄媚率从14.5%降到了不足6%。而且,它使用的表情符号也少了,回应变得更加细腻和深思熟虑。

另外,OpenAI还为用户提供了四种个性选项:愤世嫉俗者、机器人、倾听者和书呆子。这些个性最开始是用在文本聊天中,未来还会扩展到语音互动上,用户可以根据自己的喜好来调整与ChatGPT的互动风格。

在现场演示中,语音交互流畅自然,完全没有违和感。甚至在询问GPT-5用一个词回答时,它给出的答案是「Patience」(耐心)。这让现场的气氛瞬间轻松起来,主持人还调侃这可能是模型在感谢大家的耐心等待呢。

抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!

GPT-5 Pro:新晋模型,功能更强大

这次OpenAI还推出了GPT-5 Pro,替代了之前的o3-pro。这款新模型能够进行更长时间的思考,采用高效的并行计算方式,力求为用户提供最优质的答案。在1000多个真实世界的推理提示评估中,外部专家有67.8%的偏好选择了GPT-5 Pro,且其重大错误率比GPT-5减少了22%。在健康、科学、数学和编码方面的表现也得到了专家们的一致好评。

今天起,GPT-5正式成为ChatGPT的新默认模型,所有Plus、Pro、Team和免费用户都能使用。Enterprise和Edu用户将在一周后获得访问权限。

对于免费用户来说,每5小时可以发送10条消息,而Plus用户则可以每3小时发送80条消息。

抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!

Pro用户可以不受限制地使用GPT-5和GPT-5 Pro,而免费用户在达到使用限制后将自动切换到更小更快的GPT-5 mini。Pro、Plus和Team用户还可以通过ChatGPT登录Codex CLI,利用GPT-5来完成代码编写和调试等任务。

虽然GPT-5已经对所有用户开放,但免费用户并不能立刻体验到完整的功能。一旦他们达到使用限制,就会转为速度更快的小型版本GPT-5 mini。

对于开发者来说,OpenAI还推出了API平台的三个不同规格版本:gpt-5、gpt-5-mini和gpt-5-nano,开发者可以根据自己的需求灵活选择,真的是方便极了!

GPT-5的全新特性,让开发者的体验更上一层楼!

GPT-5 不仅支持回复 API 和聊天完成 API 等主流接口,还成为了 Codex CLI 的默认模型。它的各个版本都有 reasoning_effort 和 verbosity 参数,可供开发者灵活控制自定义工具,真是太方便了。

除了基本的对话功能,GPT-5 还新增了并行工具调用、内置网络搜索、文件处理和图像生成等核心功能,流式处理和结构化输出也不在话下。更妙的是,它还支持提示缓存和批量 API,从而优化成本。

最近,GPT-5 API 推出了四项全新的核心功能,大幅提升了开发者的使用体验。

首先,借助 reasoning_effort 参数,开发者可以在最小、低、中、高四种档位上灵活切换。这意味着简单任务可以快速得到回复,而复杂的问题则能进行深入思考,帮你在回答质量和速度之间找到最优解。

抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!

在回答的详细程度上,verbosity 参数提供了低、中、高三种设置,能帮助开发者控制回答的深度。例如,当询问「天空为什么是蓝色」时,低档的回答会简单明了,而高档的回答则会给出详细的科学解释。

在工具调用方面,新推出的自定义工具功能支持纯文本格式,让你不必再为 JSON 转义字符的麻烦而苦恼,特别是在处理大量代码或长文档时,更加省心。

另一个亮点是,整个执行过程都是可以追踪的。GPT-5 在执行工具调用时会主动输出进度更新,让开发者随时了解 AI 的执行计划和当前状态。

抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!

另外,与 ChatGPT 中的 GPT-5 系统不同,API 版本专为开发者需求进行优化,更加适合编程和 Agent 任务场景。

像 Windsurf、Vercel、JetBrains 等知名开发工具和平台都对 GPT-5 给予了高度评价。Windsurf 表示,GPT-5 在评估中表现出色,「与其他前沿模型相比,工具调用错误率仅为其一半」。

抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!

对于 Claude 而言,GPT-5 的发布可能是个不小的打击。

根据外媒 The Information 的报道,Anthropic 每年的收入达到了 50 亿美元,其中超过六成来自 API。而仅 Cursor 和 GitHub Copilot 这两个编程客户,就贡献了高达 14 亿美元。如此集中化的收入来源,显然暴露了 Anthropic 的脆弱之处。

编程工具的竞争真是无情啊

在编程工具的世界里,性能就意味着一切。其实呢,就算是微不足道的 5% 准确率提升,对于开发者来说,每天都能节省好几个小时调试的时间。这也是为什么 Claude 能够在编程领域迅速崛起的原因之一,毕竟 ChatGPT 在代码方面的能力当时还没那么强。

不过,机会总是有限的。随着 GPT-5 在编程任务和智能代理能力上的进步,加上 OpenAI 更加牢固的生态系统和产品推广渠道,一旦 Cursor 和 Copilot 再次回到 OpenAI 的怀抱,这将会对 Anthropic 的收入造成巨大的冲击。

说不定不久之后,我们就能迎来 Claude 5 的面世!

作者:李超凡、莫崇宇、张子豪

#别忘了关注爱范儿的官方微信公众号:爱范儿(微信号:ifanr),精彩内容第一时间送到你手上哦。

爱范儿|原文链接· ·新浪微博

来源:今日头条
原文标题:第一时间体验 GPT-5!人人免费可用,马斯克表示不服 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《抢先体验 GPT-5!人人都能免费使用,马斯克对此不满!》有9条评论

  1. GPT-5 的能力真是让人惊叹,尤其在编程和写作方面的提升,未来的应用场景可谓无限广阔。期待它能带来更多惊喜!

    回复
  2. 这次 GPT-5 的发布真是令人期待,尤其是它在复杂任务处理上的新设计,感觉未来会有更多可能性。希望它能在实际应用中表现得更加出色!

    回复
  3. GPT-5 的新功能让人印象深刻,尤其是它的编程能力和实时路由系统,确实能更好地满足用户需求。感觉未来的应用会更加智能化,期待更多实际案例的出现!

    回复
  4. GPT-5 的编程能力真是令人震惊,能够轻松生成复杂的应用和游戏,未来的开发工作将变得更加高效。OpenAI 这次的创新真是让人期待!

    回复
  5. GPT-5 的编程能力提升让人惊喜,能快速生成复杂应用,真是开发者的福音。期待它在实际项目中的表现!

    回复

发表评论