跳转到主要内容

Nano Banana 2 又快又便宜,但真的更好吗?

Google 的 Nano Banana 2 带来 4K 分辨率、主体一致性和接近 Pro 的能力,却选择了 Gemini 3.1 Flash 的速度路线。问题是:这是质量升级,还是一次成本优化?

5 分钟阅读
分享:
AI 驱动

AI 驱动 · 每小时限 20 次请求

Google 今天发布了 Nano Banana 2,也就是官方名称 Gemini 3.1 Flash Image 的新一代 AI 图像生成模型。我从最早的 Nano Banana 开始就一直用它生成头像、桌面背景和一些随机创意图,所以这次我必须认真看一下它到底变了什么,以及这些变化意味着什么。

更快、更便宜、功能更多。但它真的更好吗?还是 Google 在把规模和成本优化包装成一次升级?

命名还是挺有意思

先说一句名字。Nano Banana、Nano Banana Pro、Nano Banana 2。有人说 Google 的命名很混乱,但我其实觉得它挺有趣。其他 AI 公司都喜欢严肃的版本号,Google 直接叫 Nano Banana,你反而记住了。它有点个性。

到底变了什么

先把模型谱系放在一起看:

模型架构发布时间最高分辨率速度
Nano Banana v1Gemini 2.5 Flash2025 年 8 月1K约 3 秒
Nano Banana ProGemini 3 Pro2025 年 11 月4K8-12 秒
Nano Banana 2Gemini 3.1 Flash2026 年 2 月 26 日4K“极快”

主打功能包括:

  • 支持 4K 分辨率(512px 到 4096x4096)——相比 v1 的 1K 限制是巨大提升
  • 主体一致性,最多支持 5 个角色和 14 个物体——可以让同一个角色在多次生成中保持相似
  • 约 90% 的文字渲染准确率——比 v1 的约 80% 提高,但仍略低于 Pro 的 94%
  • 自我评审和自我修正——模型会在返回给用户前检查自己的输出
  • 实时网页依据——使用实时网页数据,让主题渲染更准确
  • 原本偏 Pro 的能力下放——数据可视化、信息图、图表、营销样稿等

API 价格大约是每张图 0.067 美元,比 Nano Banana Pro 便宜约 50%。对我个人来说,我用的是 AI Pro 年付订阅,所以日常并不会太关注单张图片成本。

Flash 与 Pro:真正的问题在架构

Nano Banana Pro 基于 Gemini 3 Pro,也就是质量优先的模型。Nano Banana 2 基于 Gemini 3.1 Flash,这是速度优化档。

值得注意的是,Google 在 2 月 19 日刚发布 Gemini 3.1 Pro,距离这次发布只有一周。按今天的状态看,3.1 Pro 是可用 Gemini 模型中最先进的。但他们默认图像生成模型选择的是 Flash。

原因大概率很直接。Flash 专为高吞吐量设计。当你的图像生成模型要成为 Gemini 应用在 141 个国家的默认能力,同时还要进入 Google Search、Lens 和 AI Mode,你就需要一个能承受巨大流量、也不会让基础设施成本失控的模型。如果把 Pro 档算力用在这个规模上,要么太贵,要么太慢。

这个工程逻辑我理解。但如果让我选,我宁愿等 10 秒拿到更好的图,也不想 2 秒拿到一张平庸的图。Google 仍然给 AI Pro/Ultra 用户提供 Nano Banana Pro,可以通过三点菜单重新生成。但这感觉像被藏起来的替代入口,而不是一个一等公民的选择。如果你收的是高价订阅费,就应该给用户一个明确开关:“快速”还是“质量”。不要把更好的模型藏在菜单里。

我真正期待的部分

最吸引我的,是主体一致性。让角色在多张图里保持相似,会打开很多以前不实用的场景。比如漫画式内容,你需要同一个角色在多个分镜里持续出现。这需要某种“视觉上下文窗口”,以前的版本很难做好。

4K 分辨率也很重要。从 1K 到 4K 不是小改进,而是从“发社交媒体够用”到“真的能用于生产工作”的差别。再加上文字渲染提升到 90%(对 AI 生成图中的文字来说,这已经很不错),它开始像一个严肃创意工具,而不只是玩具。

自我评审流水线

Nano Banana 2 包含自我评审和自我修正机制:模型会评估自己的输出,并在返回前修问题。第三方分析认为这可能包含多个内部步骤,比如规划、生成、评审、修正;不过 Google 没有公开完整流水线细节。

从工程角度看,这很有意思。把质量控制放进生成循环,意味着更少垃圾结果会直接到用户手里。但它也提出一个问题:如果 Flash 档架构需要自我修正来维持质量,那是不是反过来说明它单独无法匹配 Pro 级结果?自我修正流水线可能是 Google 在不支付 Pro 级算力的情况下缩小质量差距的方法。它是聪明的成本优化,也间接承认了 Flash 本身不够。

真正升级,还是利润率策略?

和 Nano Banana v1 比,它当然是升级。4K 分辨率、主体一致性、更好的文字渲染、更多能力,这些都是真变化。

和 Nano Banana Pro 比,事情就复杂了。你得到了接近 Pro 的功能、Flash 的速度和低 50% 的成本。但底层架构从质量优化(Pro)换成了速度优化(Flash)。自我修正流水线试图弥补这个差距,至于是否完全弥合,就是开放问题。

我认为真正发生的是:Google 需要让图像生成扩展到 141 个国家,覆盖 Search、Lens 和 Gemini 应用。Pro 档算力在这个规模下经济上不成立。所以他们做了一个基于 Flash 的模型,加上自我修正,让质量接近“足够好”,然后称它为升级。对大多数用户来说,它可能确实是升级。功能是真的,速度是真的,价格也对。

但我会反对把“更好”说成无条件结论。它对 Google 的利润率更好。对想要快速结果的普通用户更好。对那些愿意付费、愿意等待、明确追求最高图像质量的人来说——比如我——从 Pro 到 Flash 是一次取舍,不是无条件的升级。

我还是会继续用它。主体一致性本身就打开了我关心的场景,例如需要角色在多个分镜中保持一致的漫画内容。如果它真能像宣传那样工作,这次发布就值得。

但我希望 Google 不要再把 Nano Banana Pro 藏在三点菜单里。给付费用户一个真正的质量开关。

许可

Article text © 2026 Mark Huang. Licensed under Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) unless otherwise noted. 文章文本可在非商业场景下分享或翻译,但需标注原文 URL。商业使用需事先取得书面许可,并清楚引用原始来源。

代码片段、截图、第三方素材和网站源码可能适用单独条款。

建议署名: Based on "Nano Banana 2 又快又便宜,但真的更好吗?" by Mark Huang, originally published at https://markhuang.ai/zh/blog/nano-banana-2-fast-cheap-but-better.

订阅更新

Go、AI/LLM 和分布式系统的技术文章,绝不滥发。

评论

正在加载评论...