2026年智能对话机器人全网最详细制作教程（esp32+deepseek-v3）包含服务端

科技前沿 • 2026-04-04 19:15 • 阅读 0

智能对话机器人全网最详细制作教程（esp32+deepseek-v3）包含服务端本项目将详细为你介绍智能对话机器人详细制作过程首先介绍 esp32 嵌入式开发客户端这一块再介绍 deepseek v3 服务端这一块开源地址 https github com liuxingyvhuo yueyueAI ESP32 wroom 32e MAX98357 I2S SPI TFT 1 8 寸彩屏 INMP441 10045 小型音箱 6 6 5MM 4 引脚微动开关硬件的接线引脚

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

本项目将详细为你介绍智能对话机器人详细制作过程。首先介绍esp32嵌入式开发客户端这一块，再介绍deepseek-v3服务端这一块。开源地址https://github.com/liuxingyvhuo/yueyueAI。

ESP32-wroom-32e

MAX98357 I2S

SPI TFT 1.8寸彩屏

INMP441

10045小型音箱

6*6*5MM 4引脚微动开关

硬件的接线引脚

INMP441 SPI TFT 1.8寸彩屏 6*6*5MM 4引脚微动开关 MAX98357 I2S

VDD（3V3）
 GND（GND）
 SD（23）
 SCK（22）
 WS （21）
 L/D （GND）

VDD（5V5）
 GND（GND）
 SCL（4）
 SDA（16）
 RST（17）
 DC（5）
 CS（18）
 BLK（19）

一对引脚（13）
 一对引脚（GND）

Vin（3V3）
 GND（GND）
 LRC（12）
 BCLK（14）
 DIN（27）

整体接线效果：

2.1、Thonny（micropython语言）

这是thonny搭建esp32环境的详细教程：ESP32+Thonny环境搭建_thonny esp32-CSDN博客

来自编程小邢啊

烧录完固件就可以进行编程上传数据了。

3.1、pycharm

esp32作为客户端，主要用于发送信息到服务端和接收服务端处理的信息。服务端用于接收客户端的信息，将客户端的音频信息通过调用百度的API语言识别将其转化成文字，在将转化的文字传给调用的deepseek-v3模型API进行处理，然后把处理的信息传给客户端和讯飞的语音合成API，最后将大模型的回答和讯飞的语音合成音频传给esp32，实现文字显示和语音播放。

这里的unfont、st7735、new.bmf中文字库等文件要先上传到esp32上，这里的1.py、2.py、tft.py、v.py文件不用管它，这是我做测试用的。

注意要先将new.bmf中文字库上传！！！

服务端和客户端要连接同一个网络！！！

这里的server-ip需要去服务端的终端用命令去查找服务端的IP地址，注意有时候这个ip地址一段时间会自动分配新的IP地址！！！（有能力的可以把这边修改一下，让这个连接的IP固定）

在终端输入ipconfig即可查看服务端的IP地址，这个192.168.88.1就是服务器的IP地址了。

采用多线程处理，长按按键的时候进行采集发送音频，松开按键的时候进行接收服务端信息。

1.1、申请百度语音识别API

这是百度语音识别的API：语音识别_语音识别技术_百度语音识别-百度AI开放平台。

先登录进入这个网址点击开放能力的短语音识别标准版

然后进入这个页面直接点击使用

然后进入应用列表，创建应用。

这边要勾选语音识别这个产品，可以领个人的有5万次免费调用，这边因为已经领过了不方便演示。

现在就是创建好了，这里的API Key 和 Secret Key后面要用到，记得复制好。

1.2、申请deepseek-v3的API

OpenRouter这个是免费调用大模型的API

在注册登录之后就可以去创建Keys

对key命名后就可以得到keys，注意！！保存好这个keys。

1.3、申请讯飞的语音合成API

讯飞星火大模型API-大模型API-大模型接口-科大讯飞这个是讯飞的网址，先注册登录后，去领免费的语音合成次数。

点击立即体验就可以跳到控制平台

找到在线语音合成，点击购买服务量领免费的次数

领好之后回到控制界面，保存好你的APPID、APISecret、APIKey等信息

2.1、导入相应的包，初始化配置

导入相应的包，设置API信息配置，服务端用的是UDP网络协议，实时性高。

2.2、讯飞语音合成的相关函数

设置语音合成的相关函数（来自官方加自己的小修改），

2.3百度语音识别的相关函数

接收客户端的音频和百度语音识别的相关函数

2.4、调用deepseek-v3 API相关函数

这是调用deepseek-v3 API和将合成音频发送到客户端的函数。

2.5、主函数

这是主函数，这里的content后面的是对这个智能体的角色设定。注意配置客户端IP地址！在client_ip配置。

小讯

2026年当前环境下，前端如何利用 AI 提升自身价值？

上一篇 2026-04-04 19:16

2026年实现原创技术突破，科大讯飞发布星火X1.5大模型

下一篇 2026-04-04 19:14

2026年当前环境下，前端如何利用 AI 提升自身价值？ 1773289443
Moltbot 助手在 Windows 10 上安装并连接飞书教程 1773289439
百度广告巨震突发！核心代理利润腰斩半，AI崛起蚕食千亿市场 1773289435
开源 AI 助理 Clawdbot 获 Karpathy 点赞，它究竟是什么，有何亮点？ 1773289431
2026年MCP实战教程：让Cursor直接查询数据库和调用API的完整配置指南 1773289423
MacOS ARM系统下原生部署指南：DeepSeek-OCR实战详解及使用教程 1773289419
基于全国产算力训练，讯飞星火 X1 升级版深度推理大模型后天上线 1773289411
2026年cursor如何设置模型 1773289407
GPT-5.4发布24小时，OpenClaw[特殊字符]最新配置教程！ 1773289403
2026年实现原创技术突破，科大讯飞发布星火X1.5大模型 1773289451
Gemini-2.5-Pro 开发者指南：5种优化 API 接入的关键方法 1773289471
2026年科大讯飞如何凭借星火大模型实现2024年业绩大幅增长？ 1773289475
最新开源多模态音频处理模型：Kimi-Audio 1773289479
2026年前端开发又幸福了，如何实现Cursor + Figma MCP 快速还原设计稿？ 1773289483
Qwen3 30B本地部署与训练需什么配置？ 1773289487
2026年智谱发布开源视觉推理模型GLM-4.5V，刷新41项多模态推理SOTA 1773289491
2026年字节跳动发布豆包大模型2.0 主打真实世界复杂任务执行力 1773289499
2025清华DeepSeek教程：从入门到实战的完整指南 1773289503

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/223009.html