Google 发布图像生成模型 Nano Banana 2:整合实时搜索并强化文本与主体一致性

615 词

Google 正式上线 Nano Banana 2(Gemini 3.1 Flash Image),通过引入 Gemini 实时搜索能力解决生成保真度问题,并在多语言文本渲染及多对象一致性上取得核心突破。
nano_banana_2

模型能力与技术演进 (Gemini 3.1 Flash Image)

  • 实时知识 grounding:底层打通了 Gemini 的知识库与 Google 实时网络搜索(Grounding with Google Search)。根据 Google CEO Sundar Pichai 的“Window Seat”演示,模型能直接调取实时天气数据和真实地标信息,解决传统模型脱离现实环境的生成幻觉。
  • 高可用文本渲染:大幅提升了复杂图表、海报中的文字生成清晰度,不仅能准确拼写,还支持直接在图像内进行跨语言的文本本地化与翻译。
  • 多对象与分辨率控制:单次工作流最高可维持 5 个角色及 14 个对象的主体视觉一致性;原生支持从 512px 到 4K 分辨率的可控生成,覆盖 1:1 至 21:9 等十种宽高比。

部署矩阵与防伪机制

  • 生态全量替换:已在 Gemini App、Google Search (AI Mode/Lens)、Google Ads 中作为默认模型替代初代 Nano Banana。此外,视频工具 Flow 已将其设为默认且免积分(zero credits)使用的图像生成底座。
  • 溯源强制化:生成管线底层持续强化防伪,全面集成 SynthID 隐形水印并默认嵌入 C2PA (Content Credentials) 溯源元数据。