导读:本文内容来源于谷歌官方,由谷歌云钻石合作伙伴、谷歌地图一级代理商 CloudAce 深圳云一进行翻译发布。
Google 近日正式发布了 Nano Banana 2(Gemini 3.1 Flash Image) 。这一全新模型为 Flash 系列注入了高保真图像生成能力以及更先进、更快速的编辑功能 。其核心优势在于能够以卓越的性价比,支持开发者大规模部署复杂的视觉创作任务 。目前,开发者可通过 Google AI Studio 或 Gemini API 调用这些新功能(在 Google AI Studio 上使用需持有付费 API 密钥)。

Nano Banana 2 充分利用了 Gemini 模型丰富的全球知识,能够结合网络搜索结果生成增强的视觉效果 。这使得开发者可以生成基于现实参考、细节更为丰富的图像描述 。
为了展示这种视觉基础的实际应用能力,谷歌官方构建了名为 “ Window Seat ” 的示例应用 。它能结合 Nano Banana 2 的知识库与实时天气数据,创作出受全球真实地点启发的写实窗外景观 。

“ Window Seat ”应用演示
在构建动态 UI 生成器或创意工具时,文本的清晰度与准确性至关重要 。Nano Banana 2 在此领域较前代 Flash 图像模型实现了显著升级 。
- 高精度渲染:生成的图像文字清晰、精准,可满足大规模图像生产或创意应用的需求 。
- 图像内本地化(In-image Localization):支持直接在图像中生成或翻译多种语言的文本内容 。
为了展示这些功能,谷歌开发了一款名为“全球广告本地化器 (Global Ad Localizer)”的演示应用,该应用可将广告自动翻译并适配至不同国际市场 。它不仅展示了模型在文本翻译上的先进性,更体现了其对视觉元素进行同步理解与本地化处理的能力 。

全球广告本地化器 ”应用演示
Nano Banana 2 在保持极速的同时,提供了极高的视觉保真度,包括鲜艳的光影效果、丰富的纹理及锐利的细节 。此外,模型还赋予了开发者更灵活的控制权:
- 原生宽高比支持:除了现有比例外,新增了 4:1、1:4、8:1 和 1:8 的原生支持,无缝适配各种项目需求 。
- 全新 512px 分辨率层级:在原有的 1K、2K 和 4K 基础上新增 512px 选项,旨在最大限度降低延迟,适用于快速迭代和重型生产线 。
- 强化的指令遵循:该模型能够更严谨地执行复杂的、多层级的开发人员提示词(Prompts),确保输出结果精准符合预期 。
- 可配置的“思考层级”:开发者可调节模型的推理程度(默认 Minimal 或 High/Dynamic) 。这允许模型在渲染前对复杂提示词进行深度思考,从而提升输出质量与逻辑性 。
为了展示以上能力,谷歌开发了“ 宠物护照 ”演示版,只需拍摄宠物的一张照片,即可带领它开启环球旅行,游览世界各地著名地标。它能确保宠物在不同的目的地保持相同的形象。为了实现真正个性化的效果,谷歌还提供了多种创意控制设置。

“ 宠物护照 ”演示版
谷歌众多合作伙伴已将 Nano Banana 2 整合进生产流中,以实现视觉功能的规模化扩展 :
“通过集成 Nano Banana 2,Whering 成功将用户拍摄的低质量照片转化为专业级资产,同时完美保留了真实纹理。其结构化、可预测的输出能力让我们的团队在快速构建应用的同时,依然能维持用户所需的复杂图像分类功能。” —— Bianca Rangecroft, Whering CEO
Nano Banana 2 现已通过多种渠道开放接入,助力企业加速 AI 落地:
- 接入方式:开发者可通过 Google AI Studio 的 Gemini API 接入(需付费 API 密钥),或在 Vertex AI 上进行企业级部署 。
- 生态支持:该模型同步支持在 Google Antigravity 和 Firebase 中使用 。
- 联系 Cloud Ace ,获取定制化 AI 部署方案与技术支持
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/245587.html