ComfyUI QwenVL插件安装使用图文教程详解

科技前沿 • 2026-04-04 15:11 • 阅读 0

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

# ComfyUI QwenVL 插件保姆级图文教程

1. 插件简介

QwenVL 插件是一个能让 ComfyUI 支持阿里巴巴通义千问视觉语言模型的小帮手。它就像是一个翻译官，可以帮助 AI 理解我们的文字描述，并把图片中的内容转换成文字说明。

GitHub 地址：https://github.com/alexcong/ComfyUI_QwenVL

就像在手机上安装 APP 一样简单，按照下面的步骤操作：

git clone https://github.com/alexcong/ComfyUI_QwenVL

pip install -r requirements.txt

这个节点就像是一个开机按钮，需要先把它打开，后面的功能才能用。

参数详解：

参数名(UI显示)	参数名(代码里)	参数值	建议值	通俗解释	专业解释	使用示例
模型路径	model_path	文字输入	“Qwen-VL”	就像告诉电脑去哪个柜子里找工具	模型文件的存储位置	直接输入 “Qwen-VL” 即可

这个节点就像是一个会说话的相机，能看图说话。

参数详解：

参数名(UI显示)	参数名(代码里)	参数值	建议值	通俗解释	专业解释	使用示例
提示语	prompt	文字输入	“这张图片里有什么？”	就像问问题一样，想知道什么就问什么	用于询问模型的提示文本	“这只猫是什么品种？”
最大长度	max_length	数字	2048	决定回答能有多长	生成文本的最大字符数	想要详细回答就设大点
顶部概率	top_p	小数	0.9	控制回答的创意程度	采样阈值参数	0.9 比较中肯
温度	temperature	小数	0.7	控制回答的活泼程度	采样温度参数	0.7 比较自然

Q: 为什么有时候回答很简短？ A: 可以试着调高最大长度，或者问更具体的问题。

Q: 模型回答不够准确怎么办？ A: 可以调低温度值，让回答更谨慎一些。

Q: 加载模型很慢怎么办？ A: 这是正常的，就像启动大型游戏需要等待一样，耐心等待就好。

记住：第一次使用时要耐心等待模型下载，就像第一次玩游戏要更新一样。希望这个教程能帮助你轻松上手 QwenVL 插件！