Google 发布图像生成模型 Nano Banana 2：整合实时搜索并强化文本与主体一致性

2026-02-27

AI资讯

615 词

Google 正式上线 Nano Banana 2（Gemini 3.1 Flash Image），通过引入 Gemini 实时搜索能力解决生成保真度问题，并在多语言文本渲染及多对象一致性上取得核心突破。

模型能力与技术演进 (Gemini 3.1 Flash Image)

实时知识 grounding：底层打通了 Gemini 的知识库与 Google 实时网络搜索（Grounding with Google Search）。根据 Google CEO Sundar Pichai 的“Window Seat”演示，模型能直接调取实时天气数据和真实地标信息，解决传统模型脱离现实环境的生成幻觉。
高可用文本渲染：大幅提升了复杂图表、海报中的文字生成清晰度，不仅能准确拼写，还支持直接在图像内进行跨语言的文本本地化与翻译。
多对象与分辨率控制：单次工作流最高可维持 5 个角色及 14 个对象的主体视觉一致性；原生支持从 512px 到 4K 分辨率的可控生成，覆盖 1:1 至 21:9 等十种宽高比。

生态全量替换：已在 Gemini App、Google Search (AI Mode/Lens)、Google Ads 中作为默认模型替代初代 Nano Banana。此外，视频工具 Flow 已将其设为默认且免积分（zero credits）使用的图像生成底座。
溯源强制化：生成管线底层持续强化防伪，全面集成 SynthID 隐形水印并默认嵌入 C2PA (Content Credentials) 溯源元数据。