2026年保姆级教程：在Ubuntu上部署RagFlow+DeepSeek-R1的完整流程（含避坑指南）

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

# 从零到一：Ubuntu系统私有化部署RagFlow与DeepSeek-R1全流程实战

在人工智能技术快速发展的今天，私有化部署大语言模型已成为许多开发者和企业的刚需。本文将手把手带你完成Ubuntu系统下RagFlow与DeepSeek-R1的完整部署过程，不仅包含详细的操作步骤，还会分享实际部署中可能遇到的"坑"及其解决方案。无论你是刚接触大模型部署的新手，还是希望优化现有部署流程的开发者，都能从本文获得实用价值。

1. 环境准备与系统配置

1.1 硬件需求评估

在开始部署前，确保你的硬件配置满足以下最低要求：

CPU：至少4核（推荐8核以上）
内存：16GB起步（32GB更佳）
GPU：NVIDIA显卡，显存8GB以上（如RTX 3060及以上）
存储空间：至少50GB可用空间（建议预留100GB）

> 提示：DeepSeek-R1 14B模型本身就需要约28GB存储空间，加上RagFlow及其依赖组件，充足的存储空间是必须的。

1.2 软件环境配置

首先更新你的Ubuntu系统（本文以Ubuntu 22.04 LTS为例）：

sudo apt update && sudo apt upgrade -y

安装必要的系统工具：

sudo apt install -y git curl wget build-essential

1.3 CUDA与NVIDIA驱动安装

如果你的系统使用NVIDIA GPU，需要正确安装驱动和CUDA工具包：

检查可用驱动版本：

ubuntu-drivers devices

安装推荐版本的驱动：

sudo ubuntu-drivers autoinstall

安装CUDA Toolkit（以12.1版本为例）：

wget https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/cuda-ubuntu2204.pin sudo mv cuda-ubuntu2204.pin /etc/apt/preferences.d/cuda-repository-pin-600 sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/3bf863cc.pub sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/ubuntu2204/x86_64/ /" sudo apt-get update sudo apt-get -y install cuda

安装完成后，验证CUDA是否正常工作：

nvidia-smi

2. Docker环境搭建与优化

2.1 Docker引擎安装

RagFlow依赖Docker容器化部署，首先安装最新版Docker引擎：

# 卸载旧版本 sudo apt remove docker docker-engine docker.io containerd runc # 设置仓库 sudo apt install -y ca-certificates curl gnupg sudo install -m 0755 -d /etc/apt/keyrings curl -fsSL https://download.docker.com/linux/ubuntu/gpg | sudo gpg --dearmor -o /etc/apt/keyrings/docker.gpg sudo chmod a+r /etc/apt/keyrings/docker.gpg # 添加Docker官方源 echo "deb [arch="$(dpkg --print-architecture)" signed-by=/etc/apt/keyrings/docker.gpg] https://download.docker.com/linux/ubuntu "$(. /etc/os-release && echo "$VERSION_CODENAME")" stable" | sudo tee /etc/apt/sources.list.d/docker.list > /dev/null # 安装Docker sudo apt update sudo apt install -y docker-ce docker-ce-cli containerd.io docker-buildx-plugin docker-compose-plugin

验证Docker安装：

sudo docker run hello-world

2.2 Docker配置优化

为避免每次使用docker命令都需要sudo权限，将当前用户加入docker组：

sudo groupadd docker sudo usermod -aG docker $USER newgrp docker

配置国内镜像加速（以阿里云为例）：

sudo mkdir -p /etc/docker sudo tee /etc/docker/daemon.json <<-'EOF' { "registry-mirrors": ["https:// 
  
    
    
      .mirror.aliyuncs.com"] } EOF sudo systemctl daemon-reload sudo systemctl restart docker

3. RagFlow部署与配置

3.1 获取RagFlow项目

克隆官方仓库（如速度慢可考虑使用国内镜像源）：

git clone https://github.com/infiniflow/ragflow.git cd ragflow

RagFlow提供两种Docker镜像版本：

版本类型	包含内容	大小	适用场景
slim版	不含嵌入模型	~10GB	已有嵌入模型或计划使用外部嵌入服务
完整版	包含嵌入模型	~18GB	需要开箱即用的完整功能

根据需求修改.env文件选择版本：

# 编辑.env文件 nano docker/.env # 修改RAGFLOW_IMAGE变量（示例使用完整版） RAGFLOW_IMAGE=infiniflow/ragflow:v0.17.0

3.2 启动RagFlow服务

启动所有服务组件：

cd docker docker compose -f docker-compose.yml up -d

检查服务状态：

docker ps docker logs -f ragflow-server

正常启动后，访问http://localhost:80完成账号注册和登录。

4. Ollama与DeepSeek-R1模型部署

4.1 Ollama安装与配置

Ollama是本地运行大模型的轻量级框架，安装命令如下：

curl -fsSL https://ollama.com/install.sh | sh

优化Ollama配置：

修改模型存储位置（避免占用系统分区）：

sudo mkdir -p /data/ollama/models sudo chown -R $USER:$USER /data/ollama

编辑服务配置文件：

sudo systemctl edit ollama.service

添加以下内容：

[Service] Environment="OLLAMA_MODELS=/data/ollama/models" Environment="OLLAMA_HOST=0.0.0.0"

应用配置并重启服务：

sudo systemctl daemon-reload sudo systemctl restart ollama

4.2 DeepSeek-R1模型下载

下载14B参数版本的DeepSeek-R1：

ollama pull deepseek-r1:14b

由于模型较大（约28GB），下载可能需要较长时间。为提高下载速度，可以考虑：

使用国内镜像源
在非高峰时段下载
使用--insecure-registry参数跳过TLS验证（不推荐）

下载完成后验证模型：

ollama list ollama run deepseek-r1:14b

输入简单提示测试模型响应，输入/bye退出对话。

5. RagFlow与DeepSeek-R1集成

5.1 模型服务配置

登录RagFlow Web界面
导航至"模型提供商"设置
添加Ollama作为模型提供者
填写连接信息：

模型类型: chat 模型名称: deepseek-r1:14b 基础URL: http://host.docker.internal:11434

> 注意：如果RagFlow和Ollama运行在同一主机上，使用host.docker.internal作为主机名；若在不同主机，需使用实际IP地址并确保防火墙放行11434端口。

5.2 知识库创建与文档上传

创建新知识库
选择嵌入模型（可使用Ollama提供的嵌入模型）
上传文档（支持PDF、Word、Excel等多种格式）
等待文档解析完成

为提高解析速度，可调整以下参数：

# 在RagFlow的docker-compose.yml中添加环境变量 environment: - EMBEDDING_DEVICE=cuda # 使用GPU加速 - PARALLEL_WORKERS=4 # 根据CPU核心数调整

6. 常见问题排查与优化

6.1 服务启动问题

问题现象：Docker容器启动失败

解决方案：

检查日志：

docker logs ragflow-server

常见错误及修复：

错误信息	可能原因	解决方案
Connection refused	依赖服务未启动	检查redis、minio等组件状态
Port already in use	端口冲突	修改docker-compose.yml中的端口映射
Out of memory	内存不足	增加系统swap空间或物理内存

6.2 模型加载问题

问题现象：DeepSeek-R1加载缓慢或失败

优化建议：

确保Ollama服务配置正确：

sudo systemctl status ollama journalctl -u ollama -f

调整模型加载参数：

# 启动时指定GPU层数 ollama run deepseek-r1:14b --num-gpu-layers 40

监控GPU使用情况：

watch -n 1 nvidia-smi

6.3 性能优化技巧

GPU加速：确保CUDA和cuDNN正确安装，模型使用GPU推理
量化模型：考虑使用4-bit量化版本减少显存占用
批处理优化：调整RagFlow的批处理大小平衡速度和内存使用
缓存策略：合理配置Redis缓存减少重复计算

# 示例：在docker-compose.yml中调整Redis配置 services: redis: command: ["--maxmemory 2gb", "--maxmemory-policy allkeys-lru"]

7. 高级配置与扩展

7.1 多模型管理

通过Ollama可以同时部署多个模型，只需重复pull和run步骤即可。在RagFlow中可以配置多个模型提供者，实现模型间的快速切换。

7.2 外部访问配置

如需从外部网络访问部署的服务：

配置Nginx反向代理
设置HTTPS加密
添加身份验证层

示例Nginx配置：

server }

7.3 监控与日志收集

建立完整的监控体系：

使用Prometheus收集指标
Grafana可视化监控数据
ELK堆栈集中管理日志

# 示例：使用cAdvisor监控Docker容器 docker run --volume=/:/rootfs:ro --volume=/var/run:/var/run:ro --volume=/sys:/sys:ro --volume=/var/lib/docker/:/var/lib/docker:ro --volume=/dev/disk/:/dev/disk:ro --publish=8080:8080 --detach=true --name=cadvisor gcr.io/cadvisor/cadvisor:v0.47.0

在实际部署过程中，我发现最耗时的步骤往往是模型下载和环境配置。一个实用的技巧是在内网搭建本地镜像仓库，将基础镜像和模型文件预先缓存到内网服务器，可以大幅减少团队成员的部署时间。另外，定期检查各组件版本兼容性也很重要，特别是CUDA、Docker和模型框架之间的版本匹配。