谷歌深夜发布Gemini 3 Flash！编码能力超越Gemini 3 Pro，价格更具竞争力！

作者 | 冬梅

在大模型竞争进入“效率和规模同样重要”的新阶段时，谷歌再次亮出一张王牌。

最近，谷歌推出了最新的 Gemini 3 Flash 模型，号称拥有顶尖的智能，专为快速响应而设计，可以帮助大家更快地学习、构建和规划各类事务。

实际上，在模型正式发布之前，Google AI Studio 的开发平台和 Gemini API 的负责人 Logan Kilpatrick 就在 X 上发布了只有三个闪电符号的推文，这让不少网友猜测谷歌即将推出一款强调速度的 Flash 版本模型。

果然，今晚谷歌如约发布了 Gemini 3 Flash 模型。

1 谷歌推出最先进的 AI 模型 Gemini Flash 3.0

过去一年里，从 Gemini 1.5 到 3.0，谷歌不断提升在多模态、长上下文以及推理能力上的技术深度，同时也在努力降低模型的调用成本，以便在企业应用和开发者生态中建立更具性价比的竞争优势。在这样的背景下，以高效和低延迟为卖点的 Flash 系列，被视为 Gemini 系列中最能贴合实际业务需求的一条产品线。

随着外界对“更快、更便宜、更易部署”的模型需求日益增加，今晚发布的 Gemini Flash 3 被广泛认为是谷歌在推理效率和大规模应用方面的重要一步。

谷歌表示，从今天开始，Gemini 3 Flash 将面向全球数百万用户开放：

适用于 Google AI Studio、Gemini CLI 以及新的智能体开发平台 Google Antigravity 中的 Gemini API 开发者
所有用户都可以通过 Gemini 应用和 AI 模式在搜索中使用该模型。
适用于 Vertex AI 和 Gemini Enterprise 的企业用户

那么，这款模型的性能究竟如何呢？

谷歌在官网上介绍，Gemini 3 Flash 在速度和规模上并没有牺牲智能。

它在博士级别的推理和知识基准测试（例如 GPQA Diamond 90.4%）以及 Humanity’s Last Exam（不使用工具的情况下得分为33.7%）中展现出卓越的能力，足以与更大规模的顶尖模型相媲美，并且在多项基准测试中明显超越了目前最优秀的 2.5 版本模型 Gemini 2.5 Pro。

Gemini 2.5 Flash 的得分为 11%，而最新发布的 GPT-5.2 则得分为 34.5%。

此外，它在 MMMU Pro 测试中也取得了引人注目的 81.2% 的成绩，和 Gemini 3 Pro 的性能相当。

除了卓越的推理和多模态处理能力，Gemini 3 Flash 还特别注重高效设计，以突破质量、成本和速度之间的限制。在最高思维水平下处理时，Gemini 3 Flash 能够灵活调整思考时间。

2 性能优于 Gemini Pro 2.5，价格却低了很多

在更复杂的应用场景中，它可能需要更长的思考时间，但根据典型流量的测试结果，它平均使用的 token 数量比 2.5 Pro 少了30%，从而以更高的性能更精准地完成日常任务。

Gemini 3 Flash：性能与价格的完美平衡

Gemini 3 Flash 在各方面都展现出色的表现，尤其是在性能、成本和速度上都达到了新的高度。

这款产品的最大亮点就是它的速度，完全基于 Flash 系列打造，性能远超 2.5 Pro，速度竟然提升了三倍！而且价格却比之前的版本便宜了不少。

说到价格，Gemini 3 Flash 真的很有性价比哦。它的定价是每百万个输入 token 只要 0.50 美元，而输出 token 的价格则是每百万个 3 美元（音频输入依然是每百万个 1 美元）。

虽然相比于 Gemini Flash 2.5 的每百万个输入 token 0.30 美元和每百万个输出 token 2.50 美元稍贵一点，但谷歌表示，这一新模型的性能明显优于 Gemini 2.5 Pro，速度也是其三倍。而且在处理一些思维密集型任务时，Gemini 3 Flash 平均使用的 token 数量比 2.5 Pro 少了30%，这意味着用户在某些情况下可以省下不少 token。

在编程能力方面，Gemini 3 Flash 的表现也不赖，具备了 Gemini 3 的专业编码性能，同时延迟非常低，能够在高频工作中快速推理和解决问题。

在 SWE-bench Verified 的基准测试中，Gemini 3 Flash 的得分高达 78%，不仅超越了 2.5 系列，甚至超过了 Gemini 3 Pro。这款产品在代理编码、生产就绪系统和响应式互动应用之间实现了很好的平衡。

Gemini 3 Flash 在推理、工具使用和多模态功能方面的强大性能，特别适合那些想要进行复杂视频分析、数据提取和视觉问答的开发者。这意味着它可以支持更智能的应用，比如游戏助手或 A/B 测试实验，既能快速提供答案，又能进行深入推理。

比如在手部追踪的“发射球益智游戏”中，Gemini 3 Flash 就能实现多模态推理，提供几乎实时的 AI 辅助。

它还可以几乎实时地构建并 A/B 测试新的加载旋转器设计，从而简化设计到编码的整个流程。

利用多模态推理，Gemini 3 Flash 能够分析图像并添加上下文 UI 叠加层，几乎可以将静态图像转化为互动体验。

此外，它还可以接收一条指令提示，并编码出三种独特的设计变体。

值得一提的是，Gemini 3 Flash 现在也作为搜索中的 AI 模式默认推出，全球用户都能使用哦。

借助 Gemini 3 Pro 的推理能力，Gemini 3 Flash 的 AI 模式可以更好地理解用户问题的细微差别，能从用户查询的各个方面提供全面且易于理解的答案——实时提取网络上的本地信息和实用链接。最终，用户能获得一份条理清晰的分析报告和具体建议，速度快得像搜索一样。

谷歌表示，Gemini Flash 的定位更倾向于“主力机型”，而不仅仅是高端展示型模型。

Gemini Models 的高级总监兼产品负责人 Tulsee Doshi 在接受 TechCrunch 采访时表示，通过查看输入和输出的定价，可以明显看出 Flash 在成本上要低得多，非常适合处理大规模、批量化的任务，这也能有效帮助企业降低门槛和整体成本。

谷歌新模型发布引发热议，OpenAI压力增大

自从 Gemini 3 上线后，谷歌的 API 处理能力迅速攀升，现在每天处理的 token 数量已经突破了 1 万亿，真是惊人啊！

与此同时，谷歌和 OpenAI 之间的竞争也愈演愈烈，二者在新品发布和模型表现上都在较劲。

据说，这个月早些时候，谷歌在消费者市场的表现有所提升，致使 ChatGPT 的访问量出现了下降。OpenAI 的 CEO Sam Altman 为此还给内部团队发了一份被称为“红色警报”的备忘录。接着，OpenAI 接连推出了 GPT-5.2 和一款新的图像生成模型，强调企业级应用需求依然强劲。值得一提的是，自 2024 年 11 月起，ChatGPT 的消息量增长了大约 8 倍。

虽然谷歌没有明确回应与 OpenAI 的竞争关系，但他们认为，新模型频频推出正在推动整个行业向前发展。

Doshi 表示：“现在这个行业的情况是，各种模型都在迅速演进，彼此竞争，不断突破性能极限。”她还提到，各家公司正积极推出新模型，这种势头让团队对行业未来充满期待。

说到用户的反馈，谷歌新模型的发布在全球范围内引发了热烈讨论。在 X 和 Reddit 等社交平台上，很多开发者和技术爱好者对 Gemini 系列，尤其是 Flash 版本，发表了各种看法。

在 X 上，有用户试用了 Flash 3.0 后表示，Stagehand Agent 的准确度几乎可以和 Gemini 3 Pro 相提并论，但价格更便宜、速度也更快。

Browserbase 的创始人 Paul Klein IV 在 X 上分享了他们提前体验 Gemini Flash 的感受，称在实际使用时他们简直惊呆了。他感叹道：“Stagehand Agent 的准确度几乎与 Gemini 3 Pro 不相上下，但价格更低，速度更快。”

谷歌深夜发布Gemini 3 Flash！编码能力超越Gemini 3 Pro，价格更具竞争力！

在 Reddit 上，有用户忍不住感叹，真是太疯狂了！还有人表示，从来没见过这么强大的轻量级模型。

不过也有一些用户指出，基准测试的结果不一定能反映真实使用中的表现。

基准测试分数并不能完全对应真实应用场景，实际使用中情境多样，远比那些单轮对话的基准测试复杂。说实话，看到 Flash 这种轻量级模型在评分上“战胜” Pro 版，我对这种为了提高基准分的做法产生了疑虑。

最近几周，我同时使用 Gemini 3 Pro 和 Opus 4.5，这两款模型都很出色。但如果只看基准测试，Gemini 应该整体表现更好，然而实际使用中却让我失望，反倒是 Opus 4.5 一直给我带来惊喜。

还有用户认为，谷歌最近的几次发布已经彰显了其行业领导地位，而 OpenAI 似乎正被甩在了后头。

AI时代的转型与机会：一场关于未来的对话

你有没有注意到，最近关于人工智能的讨论越来越热烈？其实呢，AI正在重新定义我们的工作方式和思维模式，企业也在这股浪潮中发生了翻天覆地的变化。现在的AI不仅仅是个辅助工具，它已经成为推动企业发展的重要力量。

说到这里，12月19日至20日，AICon全球人工智能开发与应用大会（北京站）就要开始了。这次大会可不简单，聚焦于大模型的训练、推理，还有AI Agent等内容，绝对值得期待！大家会一起探讨如何构建一个既可靠又能规模化的Agentic操作系统。这样，AI就能真正帮助企业降低成本、提升效率，突破增长的瓶颈。

所以，如果你想把握这个行业变革的关键时机，千万别错过这次大会哦！

来源：今日头条

原文标题：Cursor 又“危险”了？谷歌深夜祭出 Gemini 3 Flash！编码能力反超 Gemini 3 Pro，价格还更低 – 今日头条

原文链接：https://www.toutiao.com/article/7585083091895517736/

声明：

文章来自网络收集后经过ai改写发布，如不小心侵犯了您的权益，请联系本站删除，给您带来困扰，深表歉意！