保姆级教程:将N8N升级为“全模态”神器,看图、听音样样行!

保姆级教程:将N8N升级为“全模态”神器,看图、听音样样行!今天咱们来聊个超酷 的功能 如何让你的 n8n 工作流 长眼睛 和 长耳朵 很多朋友在用 n8n 搭建 AI 应用时 发现不论怎么折腾 好像只能发文字 想发张图片让 AI 分析 或者发段语音让 AI 听听 对不起 不支持 别急 今天这篇教程就手把手教你 如何利用 全模态 Multimodal 大模型 让你的 n8n 支持文本 图片 音频 视频 的上传与多轮对话 举个栗子

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



今天咱们来聊个超酷的功能:如何让你的 n8n 工作流“长眼睛”和“长耳朵”? 🧐

很多朋友在用 n8n 搭建 AI 应用时,发现不论怎么折腾,好像只能发文字。想发张图片让 AI 分析?或者发段语音让 AI 听听?对不起,不支持。🚫

别急!今天这篇教程就手把手教你,如何利用 全模态(Multimodal) 大模型,让你的 n8n 支持文本、图片、音频、视频的上传与多轮对话!

举个栗子 🌰:

1

废话不多说,咱们直接上干货!👇


https://www.bilibili.com/video/BV1ynmwBYESL/


首先,我们需要一个入口。

在 n8n 中添加 Chat Trigger(聊天触发器)节点。
⚠️ 注意: 默认情况下,这个聊天窗口只有“发送”按钮,是不支持上传附件的。

2

怎么破?
在 Chat Trigger 的设置里,找到 Allow File Uploads(允许上传文件)选项,把它打开!✅

设置好后,你会发现你的聊天窗口多了一个回形针图标 📎(或者上传按钮)。这就意味着,你的通道已经打通了,可以接受图片、音频和视频啦!

3


即使通道通了,如果你的大模型是个“脸盲”或者“听不懂”,那也没用。所以,我们需要一个支持全模态的大模型。

在 n8n 流程中:

  1. 下一步添加节点: 这里一定要选 AI Agent
    • 敲黑板:千万别选 Basic LLM Chain,那个通常只支持纯文本,不支持多模态操作。🙅‍♂️
  2. 设置 Model: 在 AI Agent 里,我们需要配置一个 Chat Model(聊天模型)。

我们要选哪个模型呢?这就得用到阿里的百炼平台了。

  • DeepSeek:虽然很火,但目前 API 主要侧重文本和推理,全模态支持不是它的强项。
  • Qwen-Omni:这是阿里最新的全模态大模型,能看图、听音、看视频,选它准没错!

关键操作来了(必看): 🛠️

因为 n8n 原生可能没有直接的“百炼”节点,或者为了通用性,我们这里使用 OpenAI Chat Model 节点来“伪装”接入。因为百炼平台完美兼容 OpenAI 的协议!

操作步骤:

  1. 添加凭证 (Credentials):
    • 去阿里云百炼平台,注册并登录。
    • 在“API-KEY管理”里创建一个新的 Key,复制下来。
    • 在 n8n 的 OpenAI 凭证里,把这个 Key 填进去。
  2. 修改 Base URL:
    • 在百炼的模型广场找到 Qwen-Omni,点击“API参考”。
    • 复制那个 Base URL 地址。
    • 粘贴到 n8n 凭证设置里的 Base URL 栏目中。
  3. 连接测试: 点击 Save/Test,看到绿色小对勾 ✅ 就说明连接成功!

连接成功后,回到 n8n 的 OpenAI Model 节点:

  1. 在模型列表(或者手动输入)里选择 qwen-omni-turbo (或者日期后缀的最新版,如 12 月份的版本)。
  2. 关闭杂项: 那些联网搜索、文件搜索的高级功能这次用不上,统统关掉,我们只测多模态。

测试开始! 🚀

  1. 打开聊天窗口。
  2. 上传一张包含文字的图片(比如 n8n 2.0 的海报)。
  3. 输入指令:“提取图片中的文字”。
  4. 点击发送!

结果展示:

1


想要实现 n8n 全模态,必须满足两个条件,缺一不可:

  1. 入口支持:Chat Trigger 开启文件上传。
  2. 模型支持:后端必须连接支持全模态的模型(如 Qwen-Omni)。

搞定这两步,你的 n8n 就不再是只会打字的机器人,而是能看能听的超级助手了!视频和音频的原理是一样的,大家课后可以自己去试一试。

好啦,今天的教程就到这里。我是磊哥,咱们下期再见! 👋


觉得有用的话,记得点个在看支持一下哦! ❤️

本文已收录到我的技术小站 www.javacn.site,网站包含的内容有:LangChain/N8N/SpringAI/SpringAIAlibaba/LangChain4j/Dify/Coze/AI实战项目/AI常见面试题等技术分享,欢迎各位大佬光临指导~

小讯
上一篇 2026-04-05 16:15
下一篇 2026-04-05 16:13

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/221813.html