Qwen Image 2.0 今年 2 月上线。之前用 Qwen Image 生成图片要一个 API,编辑图片要换另一个。2.0 把这两件事合到了一起。跑了一下看看实际效果怎么样。
阿里通义千问团队 2026 年 2 月发布的图片模型。和之前的 Qwen Image 不同,2.0 把生成和编辑合进了同一个模型系列。用文字描述生成一张图,再用文字描述编辑它,全程同一套 API。
分辨率最大 2048 像素,中英文 prompt 都能用,有标准版和 Pro 版。还带了个 Prompt Enhancer,可以自动把你写的简单描述扩展成更详细的 prompt。
先试生成。三个不同场景。
import os os.environ["WAVESPEED_API_KEY"] = "你的key" import wavespeed # 场景 1:人像(Gregory Crewdson 风格郊区夜景) result = wavespeed.run( "wavespeed-ai/qwen-image-2.0/text-to-image", { "prompt": "A young woman standing alone on a quiet suburban street at night, a single streetlamp casting a pool of warm light around her while the rest of the street fades into deep blue darkness, she wears a light summer dress, muted tones, eerie stillness, in the style of Gregory Crewdson", "size": "1024*1024", "seed": 42, } ) print(result["outputs"][0])

郊区夜景的氛围出来了。路灯的暖色光池和周围的深蓝暗部形成了明确的冷暖分割。人物站在光池中央,有一种 Crewdson 式的"安静的不安感"。
# 场景 2:中文电影海报 result = wavespeed.run( "wavespeed-ai/qwen-image-2.0/text-to-image", { "prompt": "A cinematic movie poster, dark moody background with a silhouetted lighthouse on a rocky coast in thick fog, the large title '雾中灯塔' in bold white brush calligraphy, tagline '有些真相只在迷雾中才看得清' below, '2026 · 暑期档' at the bottom, dramatic single light beam from the lighthouse", "size": "768*1024", "seed": 42, } )

"雾中灯塔"四个字的毛笔书法渲染得很清晰。宣传语"有些真相只在迷雾中才看得清"也完整正确。底部的"2026·暑期档"没问题。整体构图有电影海报的感觉——灯塔、光束、雾气、岩石海岸。
# 场景 3:产品包装(带中文文字) result = wavespeed.run( "wavespeed-ai/qwen-image-2.0/text-to-image", { "prompt": "A premium Chinese tea packaging design, a tall matte black tin canister with gold foil text reading '明前龙井' in elegant calligraphy, below it '2026 春茶' in smaller gold text, the canister sits on a dark wooden surface with dried tea leaves, soft directional light, dark background, luxurious and minimal", "size": "1024*1024", "seed": 42, } )

茶叶罐的质感不错——哑光黑色表面、金色书法字、木桌、散落的茶叶。"明前龙井"和"2026 春茶"都渲染正确。这种产品包装图如果用在电商详情页,基本可以直接用。
这是 Qwen Image 2.0 的核心卖点之一。拿 Wan 2.7 做对比,同一个 prompt 各跑一次。
下面测试中的电影名、书名、品牌名都是编的,只用来测文字渲染效果。
三组测试:
测试 1:电影海报(大标题+宣传语+档期)

两个模型都渲染出了正确的"雾中灯塔"和宣传语。Qwen 的排版更克制——文字、灯塔、雾气,没有多余元素。Wan 2.7 自己加了"某某创业 × 某某文化 联合出品""主演:某某 × 某某 × 某某"这些 prompt 里没有的内容。Wan 的 thinking mode 会自动"补全"它认为海报应该有的元素。
测试 2:书籍封面(书名+作者+水墨插画)

Qwen 生成了一个平面设计风格的封面——水墨鸟、书名、作者名,干净利落。Wan 2.7 做成了一本立体的实物书,还自己加了"见星文化 出品"。两个模型的文字都正确。差异在于:Qwen 忠实执行 prompt,Wan 自由发挥。
测试 3:产品标签(品牌名+产品名+容量)

“沐白”“玫瑰精华水”"100ml"三层文字两个模型都渲染正确了。Qwen 的瓶子偏小,"沐白"是竖排。Wan 2.7 的瓶子更大更突出,"沐白"也是竖排但字更大更有设计感。
总结一下文字渲染:
两个模型的中文渲染准确度都很高。差异不在“能不能渲染正确”,而在“渲染出来的设计风格”。
生成一张图之后,不换模型,直接用编辑 API 改风格。
# 先生成原图 gen_result = wavespeed.run( "wavespeed-ai/qwen-image-2.0/text-to-image", { "prompt": "A young woman standing alone on a quiet suburban street at night, a single streetlamp casting warm light, deep blue darkness around, she wears a light summer dress, eerie stillness, in the style of Gregory Crewdson", "size": "1024*1024", "seed": 77, } ) source_url = gen_result["outputs"][0] # 编辑:照片转水彩 edit_result = wavespeed.run( "wavespeed-ai/qwen-image-2.0/edit", { "images": [source_url], "prompt": "Transform this photograph into a soft watercolor painting, visible brushstrokes and paper texture, the colors bleeding slightly at the edges, muted pastel tones, keep the composition and figure unchanged", "seed": 42, } )

水彩转换效果不错。笔触感出来了,颜色变成了柔和的水彩色调,构图和人物位置保持住了。路灯的暖光在水彩版本里变成了黄绿色的晕染,有一种手绘的温暖感。
不过仔细看,人物的绿色连衣裙在水彩版本里保持了原色,没有跟着整体色调变化。这说明编辑模型对"保持人物不变"的理解比较字面——它保持了衣服颜色,但理想情况下水彩风格应该让所有颜色都变成水彩色调。
同一个 prompt,两个模型各跑一次。

两个模型对同一个 prompt 的理解差异不小。Qwen 生成了东亚女性,Wan 生成了白人女性(prompt 没指定种族)。Wan 的光影对比更强更“电影感”,Qwen 更安静更写实。
Qwen Image 2.0 的 T2I 和 Edit 在 WaveSpeed 上是两个不同的端点:
- 生成:
wavespeed-ai/qwen-image-2.0/text-to-image - 编辑:
wavespeed-ai/qwen-image-2.0/edit
编辑 API 的参数名是 images(数组),不是 image。传入格式 “images”: [“url”]。
分辨率范围 256-2048。实际输出可能和请求不完全一致。
Pro 版本(wavespeed-ai/qwen-image-2.0-pro/text-to-image)细节更好。迭代阶段用标准版,最终出图换 Pro。
Wan 2.7 的 thinking mode 会自动“补全”内容——在文字渲染测试中,它自己加了出版社、演员表等 prompt 里没有的元素。这不是 bug,但如果你需要严格控制输出内容,Qwen 更可预测。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/256490.html