谷歌深夜发布Gemini 3 Flash!编码能力超越Gemini 3 Pro,价格更具竞争力!

作者 | 冬梅

在大模型竞争进入“效率和规模同样重要”的新阶段时,谷歌再次亮出一张王牌。

最近,谷歌推出了最新的 Gemini 3 Flash 模型,号称拥有顶尖的智能,专为快速响应而设计,可以帮助大家更快地学习、构建和规划各类事务。

实际上,在模型正式发布之前,Google AI Studio 的开发平台和 Gemini API 的负责人 Logan Kilpatrick 就在 X 上发布了只有三个闪电符号的推文,这让不少网友猜测谷歌即将推出一款强调速度的 Flash 版本模型。

果然,今晚谷歌如约发布了 Gemini 3 Flash 模型。

图片

1 谷歌推出最先进的 AI 模型 Gemini Flash 3.0

过去一年里,从 Gemini 1.5 到 3.0,谷歌不断提升在多模态、长上下文以及推理能力上的技术深度,同时也在努力降低模型的调用成本,以便在企业应用和开发者生态中建立更具性价比的竞争优势。在这样的背景下,以高效和低延迟为卖点的 Flash 系列,被视为 Gemini 系列中最能贴合实际业务需求的一条产品线。

随着外界对“更快、更便宜、更易部署”的模型需求日益增加,今晚发布的 Gemini Flash 3 被广泛认为是谷歌在推理效率和大规模应用方面的重要一步。

谷歌表示,从今天开始,Gemini 3 Flash 将面向全球数百万用户开放:

  • 适用于 Google AI Studio、Gemini CLI 以及新的智能体开发平台 Google Antigravity 中的 Gemini API 开发者

  • 所有用户都可以通过 Gemini 应用和 AI 模式在搜索中使用该模型。

  • 适用于 Vertex AI 和 Gemini Enterprise 的企业用户

那么,这款模型的性能究竟如何呢?

谷歌在官网上介绍,Gemini 3 Flash 在速度和规模上并没有牺牲智能。

它在博士级别的推理和知识基准测试(例如 GPQA Diamond 90.4%)以及 Humanity’s Last Exam(不使用工具的情况下得分为33.7%)中展现出卓越的能力,足以与更大规模的顶尖模型相媲美,并且在多项基准测试中明显超越了目前最优秀的 2.5 版本模型 Gemini 2.5 Pro。

Gemini 2.5 Flash 的得分为 11%,而最新发布的 GPT-5.2 则得分为 34.5%。

此外,它在 MMMU Pro 测试中也取得了引人注目的 81.2% 的成绩,和 Gemini 3 Pro 的性能相当。

图片

除了卓越的推理和多模态处理能力,Gemini 3 Flash 还特别注重高效设计,以突破质量、成本和速度之间的限制。在最高思维水平下处理时,Gemini 3 Flash 能够灵活调整思考时间。

2 性能优于 Gemini Pro 2.5,价格却低了很多

在更复杂的应用场景中,它可能需要更长的思考时间,但根据典型流量的测试结果,它平均使用的 token 数量比 2.5 Pro 少了30%,从而以更高的性能更精准地完成日常任务。

Gemini 3 Flash:性能与价格的完美平衡

Gemini 3 Flash 在各方面都展现出色的表现,尤其是在性能、成本和速度上都达到了新的高度。

这款产品的最大亮点就是它的速度,完全基于 Flash 系列打造,性能远超 2.5 Pro,速度竟然提升了三倍!而且价格却比之前的版本便宜了不少。

说到价格,Gemini 3 Flash 真的很有性价比哦。它的定价是每百万个输入 token 只要 0.50 美元,而输出 token 的价格则是每百万个 3 美元(音频输入依然是每百万个 1 美元)。

虽然相比于 Gemini Flash 2.5 的每百万个输入 token 0.30 美元和每百万个输出 token 2.50 美元稍贵一点,但谷歌表示,这一新模型的性能明显优于 Gemini 2.5 Pro,速度也是其三倍。而且在处理一些思维密集型任务时,Gemini 3 Flash 平均使用的 token 数量比 2.5 Pro 少了30%,这意味着用户在某些情况下可以省下不少 token。

在编程能力方面,Gemini 3 Flash 的表现也不赖,具备了 Gemini 3 的专业编码性能,同时延迟非常低,能够在高频工作中快速推理和解决问题。

在 SWE-bench Verified 的基准测试中,Gemini 3 Flash 的得分高达 78%,不仅超越了 2.5 系列,甚至超过了 Gemini 3 Pro。这款产品在代理编码、生产就绪系统和响应式互动应用之间实现了很好的平衡。

Gemini 3 Flash 在推理、工具使用和多模态功能方面的强大性能,特别适合那些想要进行复杂视频分析、数据提取和视觉问答的开发者。这意味着它可以支持更智能的应用,比如游戏助手或 A/B 测试实验,既能快速提供答案,又能进行深入推理。

比如在手部追踪的“发射球益智游戏”中,Gemini 3 Flash 就能实现多模态推理,提供几乎实时的 AI 辅助。

它还可以几乎实时地构建并 A/B 测试新的加载旋转器设计,从而简化设计到编码的整个流程。

利用多模态推理,Gemini 3 Flash 能够分析图像并添加上下文 UI 叠加层,几乎可以将静态图像转化为互动体验。

此外,它还可以接收一条指令提示,并编码出三种独特的设计变体。

值得一提的是,Gemini 3 Flash 现在也作为搜索中的 AI 模式默认推出,全球用户都能使用哦。

借助 Gemini 3 Pro 的推理能力,Gemini 3 Flash 的 AI 模式可以更好地理解用户问题的细微差别,能从用户查询的各个方面提供全面且易于理解的答案——实时提取网络上的本地信息和实用链接。最终,用户能获得一份条理清晰的分析报告和具体建议,速度快得像搜索一样。

谷歌表示,Gemini Flash 的定位更倾向于“主力机型”,而不仅仅是高端展示型模型。

Gemini Models 的高级总监兼产品负责人 Tulsee Doshi 在接受 TechCrunch 采访时表示,通过查看输入和输出的定价,可以明显看出 Flash 在成本上要低得多,非常适合处理大规模、批量化的任务,这也能有效帮助企业降低门槛和整体成本。

谷歌新模型发布引发热议,OpenAI压力增大

自从 Gemini 3 上线后,谷歌的 API 处理能力迅速攀升,现在每天处理的 token 数量已经突破了 1 万亿,真是惊人啊!

与此同时,谷歌和 OpenAI 之间的竞争也愈演愈烈,二者在新品发布和模型表现上都在较劲。

据说,这个月早些时候,谷歌在消费者市场的表现有所提升,致使 ChatGPT 的访问量出现了下降。OpenAI 的 CEO Sam Altman 为此还给内部团队发了一份被称为“红色警报”的备忘录。接着,OpenAI 接连推出了 GPT-5.2 和一款新的图像生成模型,强调企业级应用需求依然强劲。值得一提的是,自 2024 年 11 月起,ChatGPT 的消息量增长了大约 8 倍。

虽然谷歌没有明确回应与 OpenAI 的竞争关系,但他们认为,新模型频频推出正在推动整个行业向前发展。

Doshi 表示:“现在这个行业的情况是,各种模型都在迅速演进,彼此竞争,不断突破性能极限。”她还提到,各家公司正积极推出新模型,这种势头让团队对行业未来充满期待。

说到用户的反馈,谷歌新模型的发布在全球范围内引发了热烈讨论。在 X 和 Reddit 等社交平台上,很多开发者和技术爱好者对 Gemini 系列,尤其是 Flash 版本,发表了各种看法。

在 X 上,有用户试用了 Flash 3.0 后表示,Stagehand Agent 的准确度几乎可以和 Gemini 3 Pro 相提并论,但价格更便宜、速度也更快。

Browserbase 的创始人 Paul Klein IV 在 X 上分享了他们提前体验 Gemini Flash 的感受,称在实际使用时他们简直惊呆了。他感叹道:“Stagehand Agent 的准确度几乎与 Gemini 3 Pro 不相上下,但价格更低,速度更快。”

谷歌深夜发布Gemini 3 Flash!编码能力超越Gemini 3 Pro,价格更具竞争力!

在 Reddit 上,有用户忍不住感叹,真是太疯狂了!还有人表示,从来没见过这么强大的轻量级模型。

图片

不过也有一些用户指出,基准测试的结果不一定能反映真实使用中的表现。

基准测试分数并不能完全对应真实应用场景,实际使用中情境多样,远比那些单轮对话的基准测试复杂。说实话,看到 Flash 这种轻量级模型在评分上“战胜” Pro 版,我对这种为了提高基准分的做法产生了疑虑。

最近几周,我同时使用 Gemini 3 Pro 和 Opus 4.5,这两款模型都很出色。但如果只看基准测试,Gemini 应该整体表现更好,然而实际使用中却让我失望,反倒是 Opus 4.5 一直给我带来惊喜。

图片

还有用户认为,谷歌最近的几次发布已经彰显了其行业领导地位,而 OpenAI 似乎正被甩在了后头。

AI时代的转型与机会:一场关于未来的对话

你有没有注意到,最近关于人工智能的讨论越来越热烈?其实呢,AI正在重新定义我们的工作方式和思维模式,企业也在这股浪潮中发生了翻天覆地的变化。现在的AI不仅仅是个辅助工具,它已经成为推动企业发展的重要力量。

说到这里,12月19日至20日,AICon全球人工智能开发与应用大会(北京站)就要开始了。这次大会可不简单,聚焦于大模型的训练、推理,还有AI Agent等内容,绝对值得期待!大家会一起探讨如何构建一个既可靠又能规模化的Agentic操作系统。这样,AI就能真正帮助企业降低成本、提升效率,突破增长的瓶颈。

所以,如果你想把握这个行业变革的关键时机,千万别错过这次大会哦!

来源:今日头条
原文标题:Cursor 又“危险”了?谷歌深夜祭出 Gemini 3 Flash!编码能力反超 Gemini 3 Pro,价格还更低 – 今日头条
声明:
文章来自网络收集后经过ai改写发布,如不小心侵犯了您的权益,请联系本站删除,给您带来困扰,深表歉意!

《谷歌深夜发布Gemini 3 Flash!编码能力超越Gemini 3 Pro,价格更具竞争力!》有5条评论

  1. 谷歌推出的Gemini 3 Flash确实令人期待,尤其是它在速度和性价比上的优势,能够满足日益增长的市场需求。这样的创新对开发者来说是个好消息。

    回复
  2. Gemini 3 Flash的发布真是个好消息,既提升了推理能力,又降低了使用成本,特别适合企业和开发者。期待它在实际应用中的表现!

    回复
  3. Gemini 3 Flash的推出让我对未来的AI应用充满期待,它在速度和智能上的提升,确实能帮助我们更高效地处理日常任务。

    回复
  4. Gemini 3 Flash的发布让我眼前一亮,尤其是它在速度和智能上的兼顾,真是企业和开发者的福音。期待它能在各种应用中大放异彩。

    回复
  5. Gemini 3 Flash的推出无疑是对AI领域的一次重要推动,尤其是在提升响应速度和降低成本方面,期待它能在实际应用中展现出更大的潜力。

    回复

发表评论