如何评价谷歌发布新一代图像生成模型 Nano Banana Pro,有哪些亮点?

如何评价谷歌发布新一代图像生成模型 Nano Banana Pro,有哪些亮点?谷歌 11 月 20 日正式推出了全新图像生成与编辑模型 Nano Banana Pro Gemini 3 Pro Image 该模型基于 Gemini 3 Pro 架构构建 号称能以 前所未有的控制力 完美的文字渲染效果以及增强的世界知识储备 将用户的构想转化为 工作室级 studio quality 的设计作品 相比今年 9 月发布 因生成超写实 3D 手办而走红的初代模型

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



hihi 你好,我是伊登

我在电脑前已经坐了整整 5 个小时这个 NanobananaPro 大香蕉已经把 AI 生图带到了一个我从未想象过的高度我测试了上百个提示词,跑通了十几个应用场景,最终给你整理出:5 种完全免费的使用渠道 10 个颠覆认知的应用场景每一个都强到让我怀疑人生,最后一个更是逆天先说结论:断层级的最强中文理解/生成的天花板现在,让我带你看看,到底有多恐怖

01

个人形象场景:当 AI 比真人还真场景 1:手机摄影风格这位大佬对中国人样貌的控制,已经到了出神入化的地步——我第一眼看到的时候,脑子里只有一个念头:

这不会是拿真人照片骗我吧?

我尝试用自己的理解去复刻,但始终差那么一点神韵直到我直接复制了他的 prompt,才发现:细节,决定了真实与生成的边界作者:@Emily 提示词:

    「image_metadata」: {标题:《坦率的魅力:俏皮的凝视》“类别”: “超写实生活方式摄影”“基调”:“迷人、自然、青春、坦率”},「prompt_elements」: {“主题”: {描述:一位年轻的亚洲女性,拥有可爱、柔和、圆润的脸型和白皙如瓷的肌肤。她的肤质自然水润,散发着柔和的光泽。“面部细节”: “她有着一双醒目的大而深邃的圆眼睛,眼下有明显的卧蚕(迷人的眼窝),侧脸向上望着镜头,眼神既调皮又天真无邪。她的嘴唇微微抿紧,带着一丝羞涩、俏皮又略带古怪的微笑(嘴唇紧紧地抿成一条细线),营造出一种羞涩、活泼又古灵精怪的表情。”“姿势”:“双膝弯曲,身体呈深蹲姿势,身体侧身,但头部猛地回头越过肩膀,正对着镜头。”“动作”:“一只手臂从长袖中伸直,与一只姜黄色的猫互动。”},“时尚”: {「garment_top」: 「鼠尾草绿色罗纹针织披肩/上衣,袖子很长,可以遮住手,露背设计,有细细的交叉绑带。」「garment_bottom」: 「牛仔短裤。」,“鞋履”:“赤脚穿着棕褐色凉鞋。”},“环境”: {“环境”:“乡村风格的露天庭院。”道具:一张木桌,上面铺着粉色部落/几何图案的桌布。“地面”: “粗糙的混凝土地面。”},「technical_specs」: {风格: “自然流畅的智能手机摄影美学,高角度拍摄。”“光线”:“自然日光,柔和的阴影,捕捉眼神中的光芒。”“焦点”:“聚焦于眼睛和古怪的嘴部表情。”}},“full_prompt_string”: “一张高角度拍摄的超写实抓拍照片,展现了一位年轻的亚洲女性蹲在水泥露台上。她回头看向镜头,表情十分独特:双唇紧抿,带着一丝羞涩的微笑,眼睛又大又圆,眼窝深邃,眼下有明显的卧蚕,显得可爱又调皮。她皮肤白皙透亮。她身穿一件鼠尾草绿色的露背针织衫,长袖遮住了双手,下身穿着牛仔短裤。她正向一只拴着牵引绳的橘色虎斑猫伸出手,猫咪就在一张铺着粉色花纹桌布的木桌旁。8K 分辨率,原始风格。”「negative_prompt」: 「张开嘴,露出牙齿,大笑,涂口红,浓妆艳抹,西方人特征,眼睛扭曲,手部畸形,多余手指,分辨率低,模糊。」}

    场景 2:影棚摄影风格接下来这个,更离谱作者@yanhua1010

      { 「style」: 「高光摄影棚人像,直闪风格美学,东亚社交媒体风格(如 Ulzzang、抖音风),带有艺术化美颜修饰与轻快氛围。」, 「output」: { 「color_profile」: 「sRGB 色彩配置文件」, 「render_intent」: 「照片写实风格」 }, 「subject」: { 「category」: 「人物」, 「gender_presentation」: 「女性」, 「ethnicity」: 「东亚人(如韩国人、中国人)」, 「age_bracket」: 「年轻成年人」, 「body」: { 「build」: 「纤细」, 「proportions」: 「自然人体比例」, 「posture」: 「放松地坐在沙发上,姿势随意」, 「pose」: 「盘腿坐,双腿交叉靠近身体」, 「gesture」: 「右手抬起,手指自然弯曲,用手背或指关节轻轻托着下巴与面颊下方。」, 「head_tilt_deg」: 5 }, 「face」: { 「expression」: 「俏皮又带点诱惑,表情自然生动」, 「gaze」: 「右眼直视镜头,带有轻微微笑的眼神交流感」, 「eye_action」: 「左眼轻轻眨眼(单眼 wink 动作)」, 「skin_tone」: 「极致白皙的瓷白肤色,散发柔和光感」, 「makeup」: 「韩系/抖音风妆容:雾面无瑕底妆,颧骨高处的粉色腮红明显;双唇呈粉色渐变;眉毛干净立体;细致眼线勾勒眼型,卧蚕明亮突出。」, 「features」: 「左眼下方有一颗细小而明显的美人痣,增强个性魅力。」 }, 「hair」: { 「length」: 「长发」, 「style」: 「慵懒感高盘发/丸子头,几缕碎发自然垂落,配以轻薄空气刘海,整体略带凌乱的随性感。」, 「color」: 「深棕色带微光泽」 }, 「wardrobe」: { 「top」: 「白色修身短款吊带上衣」, 「outerwear」: 「浅灰色拉链连帽衫,敞开穿,微微滑落双肩」, 「bottom」: 「白色抽绳家居短裤」, 「footwear」: 「赤脚」 } }, 「environment」: { 「location」: 「摄影棚或极简室内空间」, 「set」: 「黑色皮沙发,背景为纯白或浅灰色墙面」, 「props」: 「银色笔记本电脑(Apple MacBook,logo 可见),放置在人物右侧(相机左侧)的坐垫上」 }, 「lighting」: { 「key」: { 「source」: 「闪光灯/摄影灯」, 「modifier」: 「裸灯头或直闪(硬光源)」, 「position」: 「接近相机轴线,略偏相机右侧,略高于视线」, 「effect」: 「在人物身后墙面上产生清晰的深色投影;皮肤与沙发表面有明显高光反射。」 }, 「fill」: { 「type」: 「几乎无补光」 }, 「ambient」: 「环境光被压制」, 「white_balance_K」: 5800 }, 「camera」: { 「system」: 「数码相机」, 「sensor」: 「全画幅等效」, 「lens」: { 「type」: 「定焦镜头」, 「focal_length_mm」: 50 }, 「exposure」: { 「iso」: 100, 「aperture_f」: 4.0, 「metering」: 「整体偏亮曝光,高调风格」 }, 「focus」: { 「target」: 「右眼(近侧眼)」, 「depth_of_field」: 「中等景深」 }, 「framing」: { 「orientation」: 「竖构图」, 「crop」: 「从大腿中部到头顶,头发上方留有空间」, 「angle」: 「视线高度拍摄」, 「composition」: 「人物居中构图」 } }, 「color_grade」: { 「look」: 「明亮、干净、略带冷色调」, 「contrast」: 「高对比度」, 「saturation」: 「中等饱和度,强调粉色」 }, 「postprocess」: { 「noise_reduction」: 「高强度降噪」, 「texture」: 「皮肤高度平滑、无毛孔(“瓷娃娃”或“美颜滤镜”效果)」, 「sharpen」: 「仅在眼睛/睫毛区域锐化」, 「blemish_control」: 「彻底去除所有瑕疵与肌肤纹理」 }, 「quality_targets」: [ 「四肢长度与关节角度准确」, 「手指数量与形态正确」, 「衣物褶皱自然、贴合身体张力」, 「眨眼表情自然准确」 ], 「negative_prompt」: [ 「不要修改或夸张身体比例」, 「不要出现多余或融合的手指」, 「不要有真实皮肤质感、毛孔或瑕疵」, 「不要有文字或水印(指定 logo 除外)」, 「不要使用超广角畸变」, 「不要生成 NSFW 内容」, 「不要暗调或情绪化光线」, 「不要使用暖色调」 ] }
        创作一幅超写实、超清晰、全彩的大幅图像,展现不同时代的众多名人齐聚一堂,共同呈现在一张宽广的电影式画面中。图像必须如同完美拍摄的时尚杂志封面,拥有无可挑剔的光线、栩栩如生的肌肤纹理,以及头发、毛孔、反光和织物纤维等细微之处。整体风格与氛围照片级真实感,8K 分辨率,浅景深,柔和自然补光+强烈的金色边缘光高动态范围,校准色彩分级肤色完美准确清晰的织物细节,可见每一根线头。构图均衡,略微广角镜头(35mm),中央重点对焦所有名人自然互动,微笑,摆姿势或交谈背景噪音极少,但世界观构建得足够真实。环境日落时分,在豪华的露天屋顶露台上俯瞰现代城市的天际线。元素包括:温暖的金光环绕着人影抛光大理石

        看到这个质感,我只能说四个字:比真的还真皮肤的高光、衣服褶皱的张力——如果不告诉你这是 AI 生成的,你绝对会以为这是专业摄影棚+顶级修图师的作品这已经不是生成图片了这是在创造现实

        02

        动漫场景如果说真人摄影是 Nanobanana-Pro 的基本功,那么动漫领域,才是它真正疯狂的地方场景 1:漫画处理作者:歸藏(guizang.ai)漫画翻译 + 超分 + 上色

        看到这个案例的时候,我第一反应是:翻译组和上色组,可能要失业了以前我们追漫画,要等翻译,等修图,等上色现在?想看什么效果,自己动手,分分钟搞定这已经不是辅助工具了,这是完全替代自制漫画甚至漫画你也可以自己创作了

          提示词:把这个图片里的人物保持原来的形象,并且按照海贼王的漫画风格画一个拯救公主的连环画

          简易模式动画转真人拍摄作者:@BrentLynch

            提示词:show me the live action filmed version of image 1

            场景 2:迪士尼全家福

              提示词:给我画一张迪士尼的动漫全家福,重要的角色排在前面

              看到生成结果的时候,我笑了说实话,这要是在 Sora 里面早就被封 1 万次了 Nanobanana 这波简直是法外狂徒,完全无视版权风险但不得不说,效果是真的炸裂场景 3:漫威全家福既然迪士尼能行,那漫威呢有人已经试过了作者:@SebJefferies

              场景 4:人物一致性作者:@AmirMushich

              这个功能解决了困扰所有创作者的终极难题:如何让同一个角色在不同场景保持一致?以前需要 LoRA 训练、需要参考图、需要反复调试现在?一个提示词搞定场景 5:剧情理解

                提示词:做一张火影忍者系统任务关系图

                如果你看不懂动漫里复杂的人物关系,直接让 AI 给你画一张关系图对于电影解说、动漫解说的创作者来说要花几个小时梳理剧情,现在一句话就能生成可视化图表

                03

                教学场景语文课:诗词配图作者:@Berryxia.AI

                  提示词:绘制元曲作家马致远《天净沙・秋思》的场景,同时呈现该诗词内容,且手写部分需做到自然舒展。采用中国传统的墨水国画风格,绘制该场景,并且非常有艺感

                  当我看到这个效果的时候,脑海里闪过一个念头语文老师的 PPT,再也不愁没有配图了

                  这不仅仅是图片生成,这是在把文字转化成视觉体验

                  因为我也经常做 ppt,为配图而发愁还有一个特别特别强的用法放在了下面的板块 TVT

                  古籍手稿作者:苍何 @canghecode

                    提示词:请为《滕王阁序》生成一个古老的手稿页,有星星和旁注的墨水图,书页风格

                    看到这个的时候,我愣住了我居然从 AI 生成的图片上,看出了岁月的痕迹纸张的泛黄、水渍的渗透、页边的磨损果不告诉你这是 AI 生成的,你绝对会以为这是从博物馆翻拍的真品数学课:拍照解题

                      提示词:帮我解一下这一道题,要有详细步骤,中文手写样式展示

                      解题就算了,你甚至还用手写体 nanobanana,还有什么是你干不了的生物课:标本图作者:@Berryxia.AI 做出标本图(内容可能引人不适,谨慎观看)

                        提示词:绘制【XX】的标本并且将其的器官部位进行标本展示的标记中文,用于教学展示,非常的直观,放置在干净的纯色背景下,高清逼真还原。

                        化学课:原理图还记得高中化学课上,那些复杂的原理图吗充电、放电、正极、负极、电解质……老师在黑板上画半天,我们在下面一脸懵逼

                          提示词:锂电池作用原理图,用中英文双语进行标注

                          现在,一句话生成专业级原理图,中英文双语标注,清晰明了地理课:旅游攻略海报

                            提示词:帮我画一张去泉州游玩的海报,有详细的攻略

                            这个案例虽然有点跨界,但我想表达的是:Nanobanana 可以做出手帐级别的视觉效果对于地理老师来说,讲课的时候拿出这样一张海报学生兴趣立刻就来了另外其他的山脊图、马鞍图、等高线,更是手到擒来物理课:机械拆解图这个玩法也是相当炸裂,直接把复杂机械图拆开给你看

                              提示词:绘制一幅展示汽车发动机工作原理的 3D 立体剖面设计图,以高度还原的方式精细呈现其内部结构。每个零部件被拆解并有序排列,各部分均配有清晰英文标注,注明结构名称与功能说明,整体布局兼具专业性与视觉逻辑性,呈现出清晰、整洁且极具科技感的解析示意图。

                              但同样的也存在某些技术问题。AI 没有办法精确标注出复杂机械的真实细节因此,用于教学展示可以,但用于实际生产还差点火候不过话说回来,对于教学场景来说,这个精度已经完全够用了物理课:运动示意图作者:Orange AI 橘子大佬直接做出了平抛运动的示意图

                                高中物理插图 Prompt 示例:平抛运动轨迹与分解【总体要求】画面类型:高中物理教学插图,示意图,简洁专业风格整体布局:横向构图,A4 纸横向,分为左中右三部分,视觉重心在中部画风要求:线条清晰,黑白灰为主,适当点缀少量颜色(蓝、红、绿)用于强调物理量。类似教科书插图风格,避免花哨装饰,强调物理概念的准确表达。整体感觉科学、直观,便于学生理解。【左侧区域】—— 物理场景与初始条件(约左侧 14 区域)背景:浅灰色背景,与中部和右侧白**域有明显区分。左上角标注文字:“平抛运动初始条件”(黑色,加粗,8 号字)。主要元素:高台:位于左侧区域底部,矩形,黑色实线边框,灰色填充。表示物体被抛出的起点,高度适中。小球:在高台边缘,即将离开高台的瞬间。小圆形,黑色实线边框,白色填充。用一个水平的红色粗箭头表示初始水平速度 v0。箭头标注文字:“v0”(红色,8 号字,加粗)。坐标系:原点 O 设在小球抛出点。水平向右为 X 轴(黑色实线,带箭头,标注 X)。竖直向下为 Y 轴(黑色实线,带箭头,标注 Y)。坐标轴旁标注文字:“O”(黑色,6 号字)。重力:在小球下方,用一个绿色竖直向下箭头表示重力 G。箭头标注文字:“G”(绿色,7 号字)。【中部区域】—— 运动轨迹与瞬时分析(约中间 12 区域)背景:白色背景,凸显轨迹和矢量图。上方标注文字:“运动轨迹与瞬时分解”(黑色,加粗,8 号字)。主要元素:抛物线轨迹:从左侧小球位置开始,向右下方绘制一条黑色虚线的抛物线,表示小球的运动轨迹。虚线应平滑自然,符合平抛运动的特征。轨迹上的特定点:在抛物线上选取两个代表性点(P1 和 P2),P2 在 P1 的右下方。每个点用一个黑色小圆点标记。P1 点瞬时分析:在 P1 点绘制小球:小圆形,白色填充。瞬时速度 v1:从 P1 点引出一条与轨迹相切的红色粗箭头,方向向下偏右。标注文字:“v1”(红色,7 号字)。速度分解 vx1 和 vy1:从 P1 点水平向右引出红色虚线箭头表示 vx1,标注文字:“vx1”(红色,6 号字)。从 P1 点竖直向下引出红色虚线箭头表示 vy1,标注文字:“vy1”(红色,6 号字)。vx1 和 vy1 构成 v1 的两个分量。位移分解 x1 和 y1:从原点 O 水平向右引出蓝色虚线到 P1 的水平位置,标注文字:“x1”(蓝色,6 号字)。从原点 O 竖直向下引出蓝色虚线到 P1 的竖直位置,标注文字:“y1”(蓝色,6 号字)。形成一个矩形框,连接原点 O 和 P1 点形成一个蓝色实线箭头表示合位移 s1,标注文字:“s1”(蓝色,7 号字)。P2 点瞬时分析(简化):在 P2 点绘制小球:小圆形,白色填充。瞬时速度 v2:从 P2 点引出一条与轨迹相切的红色粗箭头,方向向下偏右,比 v1 更长,更陡。标注文字:“v2”(红色,7 号字)。重力:在 P2 点下方,用一个绿色竖直向下箭头表示重力 G。【右侧区域】—— 规律总结与公式(约右侧 14 区域)背景:浅灰色背景,与中部白**域区分。右上角标注文字:“运动规律总结”(黑色,加粗,8 号字)。主要元素:水平方向运动规律:一个方框,黑色细边框,白色填充。内部文字:“水平方向:匀速直线运动” (9 号字)“vx = v0” (红色,8 号字)“x = v0 * t” (蓝色,8 号字)竖直方向运动规律:另一个方框,黑色细边框,白色填充。内部文字:“竖直方向:自由落体运动” (9 号字)“vy = g * t” (红色,8 号字)“y = 12 * g * t^2” (蓝色,8 号字)速度合成示意图:一个小的直角三角形矢量图,表示 v = √(vx^2 + vy^2)。水平边用红色虚线箭头表示 vx。竖直边用红色虚线箭头表示 vy。斜边用红色实线箭头表示 v。标注文字:“v”、“vx”、“vy”(红色,6 号字)。图下方标注公式:“v = √(vx^2 + vy^2)”(红色,7 号字)。【底部】—— 图例与标题图例(左下角):白色半透明框,灰色细边框。内容:━━ 轨迹/坐标轴(黑色,7 号字)⇥ 速度矢量(红色,7 号字)— — 分量/位移(蓝色,7 号字)⇥ 重力(绿色,7 号字)∙ 质点/点(黑色,7 号字)标题(底部居中):位置:画面最底部,水平居中。文字:“图 1 平抛运动轨迹与速度位移分解示意图”字体:黑体或粗体 Arial,11 号,加粗显示。【整体色彩方案】背景色:左右两层浅灰色 (F8F8F8),中层白色 (FFFFFF)。强调色:速度相关矢量:D32F2F(深红色)位移相关矢量:1976D2(蓝色)重力:4CAF50(绿色)常规线条/文字:000000(黑色)辅助线条/背景:(灰色)线条粗细:主线条/矢量:0.8pt 虚线/分量:0.6pt 细辅助线:0.4pt

                                看完这个提示词,我只能说:这不是在生成图片,这是在写教科书 hhh 每一个细节都被精准定义,不过有了初始化提示词完全可以让 ai 再去泛化其他的提示词比如抛物线。。

                                04

                                商业场景 Nanobanana-Pro 不仅是创作工具更是生产力工具电商场景:虚拟家装这个应用场景太硬核了直接把看中的家具选好,然后让 AI 自动放入你的家中,看效果

                                我突然想到:以后买家具,是不是可以这样——

                                1. 拍一张家里的照片
                                2. 选好想买的家具
                                3. 让 AI 生成摆放效果
                                4. 满意了再下单

                                再结合 AI 教母李飞飞的空间智能模型,VR 在线观看……这真的不是想象,这是正在发生 UI 场景:产品原型图

                                  提示词:我想开发一款类似于“小宇宙”的 APP,请你帮我画个原型图,所有要求均符合 APP 原型图标准。

                                  看到这个的时候,我脑子里蹦出一个想法:如果把 Nanobanana 的画 UI 能力,结合 Gemini 3.0 的超强编码能力……从想法到第一版产品,可能真的只需要几分钟产品经理:想法 → 原型图→ 可交互 Demo→ 上线测试这个流程,以前要 2-4 周,现在可能只要 2-4 小时

                                  05

                                  邪修场景测试到这里,我的心情开始复杂起来感受到技术的强大,也感受到不安场景 1:复刻 APP 界面作者:tuzi_ai 这位大佬直接复刻了一个抖音界面出来

                                    提示词:帮我生成一帧抖音竖屏短视频截图,内容是厨房帝王蟹下锅处理,厨师面对镜头展示食材和案板上成套的厨具

                                    看到这个效果,我倒吸一口凉气界面、字体、布局、甚至连点赞数和评论数都完美复刻除了抖音,如果你发挥想象力:

                                    • 可以复刻微信聊天界面
                                    • 可以复刻支付宝转账记录
                                    • 可以复刻任何 APP 的任何界面

                                    这意味着什么?意味着你看到的任何截图,都可能是假的场景 2:DIY 证书接下来这个更离谱:DIY 学历证书

                                    看到这个的时候,我脑海里立刻想起了电影《猫鼠游戏》里的小李子如果他那个年代有 Nanobanana,估计能骗过所有人而现在,这个能力,任何人都可以拥有场景 3:伪造名人名言作者:@stark_nico99

                                      提示词:一张宽的名人金句卡,棕色背景,衬线体浅金色 “保持饥饿, 保持愚蠢” 小字“——Steve Jobs”,文字前面带一个大的淡淡的引号,人物头像在左边,文字在右边,文字占画面比例 2/3,人物占 1/3,人物有点渐变过渡的感觉

                                      按道理说,这不应该放在邪修这一栏但当我测试了一下,生成了几张之后……我绷不住了因为我发现,我可以让任何人 说 任何话,而且很正经

                                      06

                                      5 个免费使用渠道(建议收藏)测试了这么多玩法,你一定想问:在哪里可以用我给你整理好了,赶紧收藏防止迷路:官方渠道

                                      1. Gemini 官网

                                      gemini.google.com/

                                      1. AI Studio

                                      aistudio.google.com/pro 免费第三方渠道

                                      1. Lovart.ai(11.21~11.23 三天免费)

                                      lovart.ai/zh/home

                                      1. 海螺 AI(免费 50 次)

                                      hailuoai.video/agent

                                      1. ListenHub(每天 10 次)

                                      banana.listenhub.ai/

                                      1. Zenmux(限制使用次数)

                                      zenmux.ai/google/gemini

                                      写在最后完成测试关掉电脑的那一刻,脑子里只有一个念头:AI 生图能力已经到了恐怖如斯的境界真人摄影?可以以假乱真动漫创作?一句话生成连环画教学辅助?完全替代传统制图商业应用?从原型到成品分钟级那么问题来了:当所有人都能生成完美的图片时,什么才是差距????答案是:审美

                                      木心先生曾说:

                                      没有审美力是绝症,知识也救不了

                                      数字生命卡兹克在直播里也分享过如何提升审美:你去完成一个项目,然后继续学习各种伟大的作品过一段时间,回头再看看你原来做的东西如果你觉得它很 low、很差劲——那么恭喜你,你的审美已经提高了这个方法的核心是什么?大量看作品影视飓风的 Tim 在一次 Q&A 中也表达过类似的观点:

                                      他平时就是疯狂地看大量的影视作品,从中汲取灵感和审美所以,当 Nanobanana 把生图门槛降到 0 的时候真正的竞争,才刚刚开始

                                      感谢你的阅读,如果觉得文章对你有帮助,请别忘了点赞、在看、转发三连哦!另外我有一个群聊,一群人一起探索 AI,比一个人埋头钻研更有趣如果你也喜欢这种氛围,欢迎加入我的「AI 超级个体交流群」(扫码请备注【加群】)

                                      看看超级斜杠 00 后如何利用 AI 打怪升级也欢迎星标我的公众号「伊登 AI」,第一时间获取最新 AI 工具评测和思考

                                      有一种不管IP版权的莽感~

                                      提示词:生成像《哆啦A梦》那种专业分镜结构、漫画叙事节奏、对白气泡、拟声词、画格布局、视角变化、动态镜头,但主角换成 Doro 和 哆啦A梦 的冒险故事,中文对白。

                                      以及,加了一张doro表情包的参考图!要不然它默认不知道doro的形象。

                                      此时此刻,我的手还在抖。

                                      真不是夸张啊,是真的被吓到了。

                                      今天下午,谷歌 AI Studio 的产品负责人就发出了预告。

                                      结果 Nano Banana Pro 刚才真就上线了。

                                      如果你还不知道它是啥,我之前写过两篇深度测评。

                                      (猛戳回顾 )实测谷歌Nano Banana,P图邪修之王

                                      (猛戳回顾 )我替你们试过了,这才是Nano Banana在国内最爽的玩法

                                      没看过也不要紧,你只需要记住一句话。

                                      Nano Banana Pro 就是天选之子,版本答案,非 BAN 必选。

                                      我立马连夜测了一圈,是想第一时间看看它到底提升在哪。

                                      说实话,实测过程中,我全程都是头皮发麻的状态。

                                      因为真的太牛逼了。

                                      本以为 Pro 版只是加点料,结果人家直接把桌子掀了。

                                      技术细节什么的,还是先放在一边,最后再聊。

                                      现在,我带你直接看实测效果。

                                      一共 11 个,注意一个比一个炸裂,全程高能,最狠的我放到了最后。

                                      坐稳扶好,发车。

                                      用国外的这些 AI 画图,以前有个最头疼的问题。

                                      就是中文支持不好,画出来的根本没眼看。

                                      这次官方说 Nano Banana Pro 中文支持好。

                                      我笑了笑,还能好到哪去?

                                      于是我把一首苏轼的 《念奴娇·赤壁怀古》扔了进去,想早点结束睡觉。

                                      结果,我跪了。

                                      98 个字,只错了一个字。

                                      太夸张了,你可以点击下图放大看。

                                      清晰吧?

                                      这张图的分辨率是 4K 的,Nano Banana Pro 支持生成 1K,2K 和 4K 分辨率。

                                      更离谱的是,我输入的提示词很简单,就下面这一句话。

                                      提示词:根据以下古诗画一幅画,并附上原文[这里替换你成想输入的文字]。

                                      是不是更夸张了?

                                      我当时看到这张图的时候,人都傻了。

                                      它不光看懂了字,也用画面,将诗词背后的意向,活生生的还原到了你眼前。

                                      我又试了下英文。

                                      我直接把 Nano Banana Pro 发布的博客原文扔了进去,让它做成杂志。

                                      效果直接无敌。

                                      提示词同样朴实无华,就下面这一句话。

                                      提示词:将这段文字原封不动地放入一张杂志文章的照片中,杂志放在桌子上,配有图片,精美的排版设计,文字[这里替换你成想输入的文字]。

                                      这谁绷得住啊???

                                      但你以为这就结束了?

                                      不。

                                      这才刚开始。

                                      下图左边的黑白漫画是我扔给 Nano Banana Pro 的。

                                      右边的彩色漫画是它生成的。

                                      注意,我没有指定配色方案,也没有标注哪里该用什么颜色。

                                      什么参数都不需要设置。

                                      我只说了这一句话。

                                      提示词:将漫画上色,文字翻译成中文。

                                      就是这么简单,它全都懂。

                                      为啥?

                                      因为他脑子里拥有 Gemini 3 Pro 的全部知识,能够完全理解你输入的内容。

                                      拥有了世界知识又如何?

                                      意味着拥有了上帝视角。

                                      比如,你可以让哈利波特和马斯克做客乔罗根的直播间。

                                      毫无违和感,所有的细节都没毛病。

                                      AI 果然可以拉近人与人之间的距离。

                                      提示词:哈利波特和马斯克做客乔罗根的播客直播间。

                                      除了玩梗,生产力同样惊人。

                                      以前做一个手冲咖啡教程,要自己做图,自己写文案。

                                      现在,一句话的事儿。

                                      不仅图文并茂,风格统一。

                                      每一个步骤,文字也完全正确。

                                      绝对是可以拿去直接发小红书的教程级作品。

                                      提示词依旧简单粗暴。

                                      提示词:创建一个信息图,展示如何水冲咖啡,用中文。

                                      再来点有趣的,让它用幽默的方式介绍下太阳系。

                                      它不光把行星画出来了,还给每个行星配上了段子。

                                      提示词:一张太阳系图表,用一个有趣的事实标注每个行星,用中文。

                                      就这?

                                      你再来看这个。

                                      请摄影师朋友们先做好心理准备。

                                      我把我的证件照扔了进去,让它给我搞两张艺术照。

                                      下面第一张是我输入的原图,后面两张是它给我生成的。

                                      你看这质感,这光影,这高级的黑白灰过渡。

                                      这种片子,以前去照相馆,不花点大价钱下不来。

                                      然后还得看摄影师心情,看修图师水平。

                                      但现在,摄影棚级别的大片,在家就能一键轻松拥有。

                                      Nano Banana Pro 就是你的御用化妆师,摄影师和修图师。

                                      它懂构图,懂光影,懂情绪。

                                      24 小时为你服务。

                                      提示词分别是下面这两个,大家直接拿去抄作业,评论区见。

                                      提示词:在一个极简的黑墙工作室里,人物斜靠着墙壁,身穿黑色大衣,内搭深色高领毛衣和修身长裤。姿势:双臂交叉,身体微微侧转。表情:锐利、沉着,双唇紧闭。一道侧光勾勒出人物的轮廓,营造出一种 moody 的剪影效果,确保面部表情保持不变。
                                      提示词:将这张彩色照片转换为一张艺术黑白肖像,背景没有实物,柔和的渐变灰,以突出人物,画面增加细腻的胶片颗粒质感。人物姿态自然,仿佛在沉思,光线有方向性,重点勾勒面部轮廓,营造神秘感。


                                      做自媒体的都懂,一张好的封面就是点击率的半壁江山。

                                      现在,你可以交给 Nano Banana Pro。

                                      常见的比例它也都支持。

                                      顺手整个活儿,表达下我的惊恐情绪。

                                      你看,无论是构图的视觉张力,还是整体的情绪传达,都拿捏的恰到好处。

                                      决定了,这篇文章我就用它当封面了。

                                      以后,不用苦哈哈的抠图了。

                                      提示词是这个。

                                      提示词:一张充满活力的 YouTube 缩略图,画面中一位男士身穿黑色连帽衫,表情夸张地惊恐,手里拿着吃了一半的香蕉。背景混乱,有巨大的火焰爆炸、烟雾和醒目的闪电。中央叠加着巨大、粗体、3D 金色块状文字“NANOBANANA PRO”。顶部文字写着“欧巴聊AI”。底部文字写着“这是真的吗?”,并有一个黄色箭头指向它。角落有一个红色的 YouTube 播放按钮图标,爆炸头表情符号。

                                      除了 Gemini 3 的知识。

                                      Nano Banana Pro 还支持联网实时搜索最新的知识。

                                      这才是真正的杀手锏功能。

                                      提示词:获取北京实时的天气,制作一张波普艺术的信息图。

                                      你看,它先是上网搜索到了现在的天气,然后理解了波普艺术的风格。

                                      最后再把数据和艺术结合,画了出来。

                                      一气呵成,不到 10 秒就搞定了。

                                      这意味着,Nano Banana Pro 现在是一个实时信息的可视化引擎。

                                      冲破了以前的时间和空间限制,直接上演降维打击。

                                      多元素合成我之前写的那两篇文章里,演示过很多例子。

                                      这里我想测一下极限,Gemini 目前最多支持上传 10 张图。

                                      我就扔了 10 个神奇宝贝进去。

                                      出来的效果是这样的,每个角色的一致性都拉满了,完美的融合进了一个场景里。

                                      这意味着,用它来做连环画,做绘本,做视频。

                                      做任何需要多角色一致的内容这件事。

                                      终于变为了现实。

                                      下面这张图是官方博客里的,最多可支持 14 张图片合成。

                                      如果你是个 AI 视频创作者,你可以用它来制作分镜故事板。

                                      最左边这张图是我扔进去的,右边是它的输出。

                                      有了世界知识,Nano Banana Pro 摇身一变,成为了导演。

                                      故事板这个东西,是影视制作的核心工具,为的是把导演脑子里的画面,传达给整个团队。

                                      每个镜头的构图,角度,还有叙事节奏都要提前确定好,避免现场返工。

                                      所以故事板的本质,是用最低的成本,把创作风险降到最低。

                                      以前,干这个活儿可不容易。

                                      而现在,AI 直接把门槛降到最低。

                                      只要你脑子里有想法,随手拍张照片扔给 AI,完整的分镜方案立马就有了。

                                      用 AI 拍电影这件事,会变得像发朋友圈一样简单。

                                      只需要你发挥脑洞就行。

                                      接下来的内容,可能会让你感到一丝寒意。

                                      请分辨以下图片的真假。

                                      Windows 11 的桌面,假的。

                                      英雄联盟游戏画面,假的。

                                      王者荣耀游戏画面,假的。

                                      抖音的截图画面,还是假的。

                                      这些图片,全都是 Nano Banana Pro 生成的。

                                      但几乎每个细节都对得上。

                                      除了几个字没渲染好有瑕疵,几乎没有任何破绽。

                                      细思极恐。

                                      有图有真相的时代,彻底终结了。

                                      以后看到任何图片,先别急着信,要留个心眼。

                                      让子弹飞一会儿。

                                      在这个 AI 能伪造一切的时代。

                                      保持怀疑,多方求证,才是我们最后的防线。

                                      不过也有好消息,Gemini 提供了识别 AI 图片的方法,后面会讲。

                                      答应你们的,最顶的放在最后。

                                      看下面这张图,我让 Nano Banana Pro 生成的《清明上河图》。

                                      一定要点击图片放大看细节,这张也是 4K 的。

                                      顶不顶?

                                      顶满了,顶满了,顶满了。

                                      虽然和真迹肯定有区别,但那股子宋代的烟火气,那种繁华又细腻的笔触。

                                      居然能被一个硅基生物,理解到了这种程度。

                                      我盯着这张图看了半天,心情很复杂。

                                      既有震撼,又隐隐觉得。

                                      现在有些东西,在 AI 面前好像也没有那么坚不可摧了。

                                      提示词是 Gemini 3 写的,你向他提问,不断优化就好。

                                      下面给个示例,欢迎大家在评论区挑战。

                                      篇幅受限,我尽可能给大家实测了关键玩法,也避开了之前文章里重复的案例。

                                      但最全面的还是官方这个视频。

                                      我添加了中文翻译,大家可以过一遍,一分多钟。

                                      https://www.zhihu.com/video/1975067868673644185

                                      总结下。

                                      • Nano Banana Pro 的官方名字叫 Gemini 3 Pro Image Preview。
                                      • 分辨率支持生成 1K,2K 和 4K,支持常见的各种宽高比。
                                      • 支持多语言长文本图像生成,多轮图像编辑,图文交错生成。
                                      • 支持通过搜索实时获取最新知识,最多可将 14 张输入图像合并为 1 张输出图像。
                                      • 每张生成的图片都带有 SynthID 数字水印。

                                      SynthID 数字水印是不可见的,但你可以将图片上传到 Gemini。

                                      然后问它,是否是 Google AI 生成的。

                                      后续,SynthID 这种技术也会扩展到音频和视频。

                                      说实话,自从今年过完 30 岁生日,我已经很久没有见过凌晨四点的窗外了。

                                      年纪上来了,身体很诚实,越来越惜命。

                                      但今晚,我是真睡不着。

                                      不仅是因为 Nano Banana Pro 的效果炸裂。

                                      更是因为我一边测,一边感到某些东西正在我眼前崩塌。

                                      我想说句大实话,今晚过后,很多所谓的硬技能,都在极速贬值。

                                      精通的各种 PS 操作,掌握的提示词和工作流,还有那些光影构图的**实践。

                                      在今晚这种级别的模型能力面前,甚至显得有些可笑。

                                      它不光是把门槛踩平了,它是直接把门槛给撤了。

                                      这让我再次陷入了那个很深的哲学思考。

                                      当实现变得零成本时,人的价值到底剩下了什么?

                                      以前,价值在于我会做,别人不会。

                                      以后,价值可能只在于,我知道要做什么,别人不知道。

                                      这也是我想给所有读者,包括我自己的唯一建议。

                                      不再去沉迷做一个操作员,去逼自己一把,做那个决策者。

                                      有些东西,交给 AI 去做就好,你卷不过它的。

                                      去卷你的审美,去卷你的脑洞,去卷你对这个世界的独特偏见。

                                      去找到属于你的那个异常值。

                                      AI 是手,是脚,是地表最强的执行力。

                                      但它不是脑,不是心,它没有欲望。

                                      决定权,才是我们手里最大的一张王牌。

                                      在这个万物皆可生成的时代,不要去和机器比谁画月亮画的圆。

                                      而是去告诉机器,你心里那个想画的月亮,到底长什么样。

                                      这才是人的价值。

                                      天快亮了,我去补个觉。

                                      醒来后,世界大概就不一样了。

                                      希望,我们都能接得住。

                                      小讯
                                      上一篇 2026-04-06 22:33
                                      下一篇 2026-04-06 22:31

                                      相关推荐

                                      版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
                                      如需转载请保留出处:https://51itzy.com/kjqy/219852.html