onnx模型部署java（onnx模型部署到单片机）

科技前沿 • 2025-05-01 13:32 • 阅读 97

大家好，我是讯享网，很高兴认识大家。

 <p id="main-toc"><strong>目录</strong></p>

讯享网

一、langchain-chatchat0.3.1的安装

二、安装模型部署框架（xinference）

三、运行模型部署框架（xinference）、下载启动所需模型

1、运行xinference

2、下载、启动模型

第一种方法：直接在xinference上下载，并启动模型：

第二种方法：手动下载模型，在xinference上启动

下载embedding模型（bge-large-zh-v1.5）：

下载LLM（Qwen2.5-7B-Instruct-GPTQ-Int8）：

四、运行langchain-chatchat0.3.1

1、创建文件夹(eg:文件夹名为langchian-chatchat）

用于放置langchain-chatchat0.3.1项目，并进入到文件夹

讯享网

2、创建并激活虚拟环境（eg:环境名为langchain）

3、下载项目

讯享网

讯享网

4、安装

https://github.com/chatchat-space/Langchain-Chatchat?tab=readme-ov-file：从 0.3.0 版本起，Langchain-Chatchat 不再根据用户输入的本地模型路径直接进行模型加载，涉及到的模型种类包括 LLM、Embedding、Reranker 及后续会提供支持的多模态模型等，均改为支持市面常见的各大模型推理框架接入，如 Xinference、Ollama、LocalAI、FastChat、One API 等。因此，请确认在启动 Langchain-Chatchat 项目前，首先进行模型推理框架的运行，并加载所需使用的模型。

这里用的是Xinference

1、创建并激活一个新的虚拟环境

为避免依赖冲突，要将 Langchain-Chatchat 和模型部署框架 Xinference 放在不同的 Python 虚拟环境中