最近GPT Image 2火遍全网,各种"秒杀一切"的截图刷屏。
同样的提示词,换到Nano Banana身上,结果真的差那么多吗?
海报级人生照片
根据参考图中的人物,生成典藏级恢弘电影海报,人物角色侧面轮廓内部延展出完整的叙事宇宙与标志性场景。风格融合电影海报与空灵水彩插画,氛围静谧、壮阔、庄重、眷恋,铺以纸纹质感薄雾效果,考究留白,并巧妙嵌入署名"FU SHENG"
这道题考的是"轮廓内部有标志性场景"这个概念,模型能不能真正读懂,其实考验的是推理理解能力了。画面上明显GPT Image 2更胜一筹没的说,但让我有点意外的是Nano Banana生成的这张,提示词里完全没提到龙虾元素,它自己加上去了,而且EasyClaw的logo也是对的。

杂志内页
根据参考图中的人物,设计一页现代科技精英刊物内页,呈现真实杂志内页效果。整体需具备专业的排版布局,内容要素包含:占据主要版面的大幅模特主图;刊物标题,副标题、注解、辅助文字。版面大气,编排有序,若仿真实期刊,要避免海报式单一感,切忌仅放置单张人物大图。
这题其实考的不光是作图水平了,海报里面的文字全都是它自己生成的,我提示词里一点没有,文字内容上都还算靠谱,联想推理能力在线。就图片来说我觉得GPT的排版更清晰易读,而且没有一个乱码,但不得不说Nano Banana对我们产品挺了解啊,就是乱码挺出戏。

电影分镜头
生成 3×3 的电影分镜头,主人公是参考图中的人物,他去到宇宙寻找新的人类生存之地,模拟斯坦尼康拍摄效果,16:9。
这道题两张答卷差距有点离谱,主要看叙事连贯性。九格画面,主角不能换脸,故事得讲得通。所以看完这两张图相信你和我有一样的疑惑,为啥Nano Banana Pro生成的图里我变成成龙了?


年代感老照片
给我生成一张旧照片,东北过年时的照片,使用90年代中国老照片的风格,左下角标注时间。
本局依然是GPT完胜,光影自然,人物表情有种"来照相了、站好站好"的正经感,左下角的时间戳也很细节,甚至对联也算工整。
第二张好看是好看,就是太好看了。光打得太均匀,每个人脸都清楚,像精心布置过但还是穿帮了的剧照,比如这个春联确实是“春联”,比如大冷天在室外支个锅做饭吃饺子,所以我说很多时候AI对人的常识其实是不理解的。


字体视觉
生成一张“基于词意进行视觉转译”的高级概念海报。文字、图像、构图、色彩共同组成一个完整、聪明、克制、极简但有力的视觉表达。画面必须优先采用“极简主场景+承载面+角色演绎+巨型文字骨架”的构图逻辑,尽量出现一个明确的横向承载结构,像舞台、土地、台基、坡面、切面、地平线、平台、表层、底座或简化的场域。用户输入的文字、单词、词组或字母必须成为画面的主视觉骨架,以巨大、清晰、强识别度的方式出现,占据画面重要区域。整体风格应接近高级图形艺术海报,具有印刷品气质,允许带有拼贴感、石版印刷感、丝网印刷感、版画感、纸张颗粒等。 我将提供给你核心文字 :未来。可选情绪倾向是科幻式的。
这道题考的是能不能真正做到让字成为构图的一部分,而不是后期浮贴。
GPT依然秒杀Nano Banana。我虽然不太懂艺术构图,但我能get到人站在字里面,光从笔画的缝隙里透出来,感觉人是在"未来"这个空间里存在的,字和画是一回事,Nano Banana还是生硬了点。

仿写手写字体
提供人工手写英文参考图,让模型模仿字迹重新生成文字内容。差距也是一目了然了,不知道Nano Banana Pro从哪里学来的衡水体。

我的结论
GPT Image 2,可以说是全面压制。
就我测得这几道题来看,每一题都赢,而且赢的姿势不一样,有时候是理解深度的差距,有时候是细节还原的差距。Nano Banana不是不能用,但放在GPT Image 2面前,差距还是很真实的。
当然,工具没有绝对的好坏,只有适不适合你的场景。但测试本身,是最诚实的答案。
最后,如果你想试试让龙虾帮你提效,欢迎下载EasyClaw:
国内版:easyclaw.cn
国际版:easyclaw.com
企业版:easyclaw.work

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/283485.html