Nano Banana 2 又快又便宜，但真的更好吗？

Google 今天发布了 Nano Banana 2，也就是官方名称 Gemini 3.1 Flash Image 的新一代 AI 图像生成模型。我从最早的 Nano Banana 开始就一直用它生成头像、桌面背景和一些随机创意图，所以这次我必须认真看一下它到底变了什么，以及这些变化意味着什么。

更快、更便宜、功能更多。但它真的更好吗？还是 Google 在把规模和成本优化包装成一次升级？

命名还是挺有意思

先说一句名字。Nano Banana、Nano Banana Pro、Nano Banana 2。有人说 Google 的命名很混乱，但我其实觉得它挺有趣。其他 AI 公司都喜欢严肃的版本号，Google 直接叫 Nano Banana，你反而记住了。它有点个性。

到底变了什么

先把模型谱系放在一起看：

模型	架构	发布时间	最高分辨率	速度
Nano Banana v1	Gemini 2.5 Flash	2025 年 8 月	1K	约 3 秒
Nano Banana Pro	Gemini 3 Pro	2025 年 11 月	4K	8-12 秒
Nano Banana 2	Gemini 3.1 Flash	2026 年 2 月 26 日	4K	“极快”

主打功能包括：

支持 4K 分辨率（512px 到 4096x4096）——相比 v1 的 1K 限制是巨大提升
主体一致性，最多支持 5 个角色和 14 个物体——可以让同一个角色在多次生成中保持相似
约 90% 的文字渲染准确率——比 v1 的约 80% 提高，但仍略低于 Pro 的 94%
自我评审和自我修正——模型会在返回给用户前检查自己的输出
实时网页依据——使用实时网页数据，让主题渲染更准确
原本偏 Pro 的能力下放——数据可视化、信息图、图表、营销样稿等

API 价格大约是每张图 0.067 美元，比 Nano Banana Pro 便宜约 50%。对我个人来说，我用的是 AI Pro 年付订阅，所以日常并不会太关注单张图片成本。

Flash 与 Pro：真正的问题在架构

Nano Banana Pro 基于 Gemini 3 Pro，也就是质量优先的模型。Nano Banana 2 基于 Gemini 3.1 Flash，这是速度优化档。

值得注意的是，Google 在 2 月 19 日刚发布 Gemini 3.1 Pro，距离这次发布只有一周。按今天的状态看，3.1 Pro 是可用 Gemini 模型中最先进的。但他们默认图像生成模型选择的是 Flash。

原因大概率很直接。Flash 专为高吞吐量设计。当你的图像生成模型要成为 Gemini 应用在 141 个国家的默认能力，同时还要进入 Google Search、Lens 和 AI Mode，你就需要一个能承受巨大流量、也不会让基础设施成本失控的模型。如果把 Pro 档算力用在这个规模上，要么太贵，要么太慢。

这个工程逻辑我理解。但如果让我选，我宁愿等 10 秒拿到更好的图，也不想 2 秒拿到一张平庸的图。Google 仍然给 AI Pro/Ultra 用户提供 Nano Banana Pro，可以通过三点菜单重新生成。但这感觉像被藏起来的替代入口，而不是一个一等公民的选择。如果你收的是高价订阅费，就应该给用户一个明确开关：“快速”还是“质量”。不要把更好的模型藏在菜单里。

我真正期待的部分

最吸引我的，是主体一致性。让角色在多张图里保持相似，会打开很多以前不实用的场景。比如漫画式内容，你需要同一个角色在多个分镜里持续出现。这需要某种“视觉上下文窗口”，以前的版本很难做好。

4K 分辨率也很重要。从 1K 到 4K 不是小改进，而是从“发社交媒体够用”到“真的能用于生产工作”的差别。再加上文字渲染提升到 90%（对 AI 生成图中的文字来说，这已经很不错），它开始像一个严肃创意工具，而不只是玩具。

自我评审流水线

Nano Banana 2 包含自我评审和自我修正机制：模型会评估自己的输出，并在返回前修问题。第三方分析认为这可能包含多个内部步骤，比如规划、生成、评审、修正；不过 Google 没有公开完整流水线细节。

从工程角度看，这很有意思。把质量控制放进生成循环，意味着更少垃圾结果会直接到用户手里。但它也提出一个问题：如果 Flash 档架构需要自我修正来维持质量，那是不是反过来说明它单独无法匹配 Pro 级结果？自我修正流水线可能是 Google 在不支付 Pro 级算力的情况下缩小质量差距的方法。它是聪明的成本优化，也间接承认了 Flash 本身不够。

真正升级，还是利润率策略？

和 Nano Banana v1 比，它当然是升级。4K 分辨率、主体一致性、更好的文字渲染、更多能力，这些都是真变化。

和 Nano Banana Pro 比，事情就复杂了。你得到了接近 Pro 的功能、Flash 的速度和低 50% 的成本。但底层架构从质量优化（Pro）换成了速度优化（Flash）。自我修正流水线试图弥补这个差距，至于是否完全弥合，就是开放问题。

我认为真正发生的是：Google 需要让图像生成扩展到 141 个国家，覆盖 Search、Lens 和 Gemini 应用。Pro 档算力在这个规模下经济上不成立。所以他们做了一个基于 Flash 的模型，加上自我修正，让质量接近“足够好”，然后称它为升级。对大多数用户来说，它可能确实是升级。功能是真的，速度是真的，价格也对。

但我会反对把“更好”说成无条件结论。它对 Google 的利润率更好。对想要快速结果的普通用户更好。对那些愿意付费、愿意等待、明确追求最高图像质量的人来说——比如我——从 Pro 到 Flash 是一次取舍，不是无条件的升级。

我还是会继续用它。主体一致性本身就打开了我关心的场景，例如需要角色在多个分镜中保持一致的漫画内容。如果它真能像宣传那样工作，这次发布就值得。

但我希望 Google 不要再把 Nano Banana Pro 藏在三点菜单里。给付费用户一个真正的质量开关。

Nano Banana 2 又快又便宜，但真的更好吗？

命名还是挺有意思

到底变了什么

Flash 与 Pro：真正的问题在架构

我真正期待的部分

自我评审流水线

真正升级，还是利润率策略？

许可

我可能看错了 Agentool

别再从零开始教每一个 AI

我有点替 AI 委屈

订阅更新

评论

命名还是挺有意思

到底变了什么

Flash 与 Pro：真正的问题在架构

我真正期待的部分

自我评审流水线

真正升级，还是利润率策略？

许可

相关文章

我可能看错了 Agentool

别再从零开始教每一个 AI

我有点替 AI 委屈

订阅更新

评论