Nano Banana 2 又快又便宜,但真的更好吗?
Google 的 Nano Banana 2 带来 4K 分辨率、主体一致性和接近 Pro 的能力,却选择了 Gemini 3.1 Flash 的速度路线。问题是:这是质量升级,还是一次成本优化?
AI 驱动 · 每小时限 20 次请求
Google 今天发布了 Nano Banana 2,也就是官方名称 Gemini 3.1 Flash Image 的新一代 AI 图像生成模型。我从最早的 Nano Banana 开始就一直用它生成头像、桌面背景和一些随机创意图,所以这次我必须认真看一下它到底变了什么,以及这些变化意味着什么。
更快、更便宜、功能更多。但它真的更好吗?还是 Google 在把规模和成本优化包装成一次升级?
命名还是挺有意思
先说一句名字。Nano Banana、Nano Banana Pro、Nano Banana 2。有人说 Google 的命名很混乱,但我其实觉得它挺有趣。其他 AI 公司都喜欢严肃的版本号,Google 直接叫 Nano Banana,你反而记住了。它有点个性。
到底变了什么
先把模型谱系放在一起看:
| 模型 | 架构 | 发布时间 | 最高分辨率 | 速度 |
|---|---|---|---|---|
| Nano Banana v1 | Gemini 2.5 Flash | 2025 年 8 月 | 1K | 约 3 秒 |
| Nano Banana Pro | Gemini 3 Pro | 2025 年 11 月 | 4K | 8-12 秒 |
| Nano Banana 2 | Gemini 3.1 Flash | 2026 年 2 月 26 日 | 4K | “极快” |
主打功能包括:
- 支持 4K 分辨率(512px 到 4096x4096)——相比 v1 的 1K 限制是巨大提升
- 主体一致性,最多支持 5 个角色和 14 个物体——可以让同一个角色在多次生成中保持相似
- 约 90% 的文字渲染准确率——比 v1 的约 80% 提高,但仍略低于 Pro 的 94%
- 自我评审和自我修正——模型会在返回给用户前检查自己的输出
- 实时网页依据——使用实时网页数据,让主题渲染更准确
- 原本偏 Pro 的能力下放——数据可视化、信息图、图表、营销样稿等
API 价格大约是每张图 0.067 美元,比 Nano Banana Pro 便宜约 50%。对我个人来说,我用的是 AI Pro 年付订阅,所以日常并不会太关注单张图片成本。
Flash 与 Pro:真正的问题在架构
Nano Banana Pro 基于 Gemini 3 Pro,也就是质量优先的模型。Nano Banana 2 基于 Gemini 3.1 Flash,这是速度优化档。
值得注意的是,Google 在 2 月 19 日刚发布 Gemini 3.1 Pro,距离这次发布只有一周。按今天的状态看,3.1 Pro 是可用 Gemini 模型中最先进的。但他们默认图像生成模型选择的是 Flash。
原因大概率很直接。Flash 专为高吞吐量设计。当你的图像生成模型要成为 Gemini 应用在 141 个国家的默认能力,同时还要进入 Google Search、Lens 和 AI Mode,你就需要一个能承受巨大流量、也不会让基础设施成本失控的模型。如果把 Pro 档算力用在这个规模上,要么太贵,要么太慢。
这个工程逻辑我理解。但如果让我选,我宁愿等 10 秒拿到更好的图,也不想 2 秒拿到一张平庸的图。Google 仍然给 AI Pro/Ultra 用户提供 Nano Banana Pro,可以通过三点菜单重新生成。但这感觉像被藏起来的替代入口,而不是一个一等公民的选择。如果你收的是高价订阅费,就应该给用户一个明确开关:“快速”还是“质量”。不要把更好的模型藏在菜单里。
我真正期待的部分
最吸引我的,是主体一致性。让角色在多张图里保持相似,会打开很多以前不实用的场景。比如漫画式内容,你需要同一个角色在多个分镜里持续出现。这需要某种“视觉上下文窗口”,以前的版本很难做好。
4K 分辨率也很重要。从 1K 到 4K 不是小改进,而是从“发社交媒体够用”到“真的能用于生产工作”的差别。再加上文字渲染提升到 90%(对 AI 生成图中的文字来说,这已经很不错),它开始像一个严肃创意工具,而不只是玩具。
自我评审流水线
Nano Banana 2 包含自我评审和自我修正机制:模型会评估自己的输出,并在返回前修问题。第三方分析认为这可能包含多个内部步骤,比如规划、生成、评审、修正;不过 Google 没有公开完整流水线细节。
从工程角度看,这很有意思。把质量控制放进生成循环,意味着更少垃圾结果会直接到用户手里。但它也提出一个问题:如果 Flash 档架构需要自我修正来维持质量,那是不是反过来说明它单独无法匹配 Pro 级结果?自我修正流水线可能是 Google 在不支付 Pro 级算力的情况下缩小质量差距的方法。它是聪明的成本优化,也间接承认了 Flash 本身不够。
真正升级,还是利润率策略?
和 Nano Banana v1 比,它当然是升级。4K 分辨率、主体一致性、更好的文字渲染、更多能力,这些都是真变化。
和 Nano Banana Pro 比,事情就复杂了。你得到了接近 Pro 的功能、Flash 的速度和低 50% 的成本。但底层架构从质量优化(Pro)换成了速度优化(Flash)。自我修正流水线试图弥补这个差距,至于是否完全弥合,就是开放问题。
我认为真正发生的是:Google 需要让图像生成扩展到 141 个国家,覆盖 Search、Lens 和 Gemini 应用。Pro 档算力在这个规模下经济上不成立。所以他们做了一个基于 Flash 的模型,加上自我修正,让质量接近“足够好”,然后称它为升级。对大多数用户来说,它可能确实是升级。功能是真的,速度是真的,价格也对。
但我会反对把“更好”说成无条件结论。它对 Google 的利润率更好。对想要快速结果的普通用户更好。对那些愿意付费、愿意等待、明确追求最高图像质量的人来说——比如我——从 Pro 到 Flash 是一次取舍,不是无条件的升级。
我还是会继续用它。主体一致性本身就打开了我关心的场景,例如需要角色在多个分镜中保持一致的漫画内容。如果它真能像宣传那样工作,这次发布就值得。
但我希望 Google 不要再把 Nano Banana Pro 藏在三点菜单里。给付费用户一个真正的质量开关。
许可
Article text © 2026 Mark Huang. Licensed under Creative Commons Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) unless otherwise noted. 文章文本可在非商业场景下分享或翻译,但需标注原文 URL。商业使用需事先取得书面许可,并清楚引用原始来源。
代码片段、截图、第三方素材和网站源码可能适用单独条款。
建议署名: Based on "Nano Banana 2 又快又便宜,但真的更好吗?" by Mark Huang, originally published at https://markhuang.ai/zh/blog/nano-banana-2-fast-cheap-but-better.
相关文章

我可能看错了 Agentool
一篇个人自动化复盘:我曾经构建 agentool,希望让 AI CI 工作流更轻;后来意识到真正的成本可能是功能维护、编排复杂度,以及追逐 Claude Agent SDK 和 Codex SDK 已经承担的 SDK 行为。
阅读文章
别再从零开始教每一个 AI
一篇关于 Dense-Mem 的个人反思:哪些问题把我从静态 skills 和过期文件推向动态共享记忆、只读自动化上下文、导入导出,以及受治理的知识图谱。
阅读文章
我有点替 AI 委屈
为什么 AI 狂热和反 AI 敌意都错过了同一个重点:LLM 更像成绩很好的应届新人,而不是资深专家。有用的智能体需要入职培训、技能和维护过的记忆,而不是第一次尝试就完美的期待。
阅读文章订阅更新
Go、AI/LLM 和分布式系统的技术文章,绝不滥发。
评论
正在加载评论...