2026年一步一步教你部署ktransformers，大内存单显卡用上Deepseek-R1

科技前沿 • 2026-04-06 13:06 • 阅读 1

一步一步教你部署ktransformers，大内存单显卡用上Deepseek-R1CPU intel 四代至强及以上 AMD 参考同时期产品内存 800GB 以上内存性能越强越好建议 DDR5 起步显卡 Nvidia 显卡单卡显存至少 24GB 用 T4 16GB 显卡实测会在加载模型过程中爆显存 nvidia compute capability 至少 8 0 CUDA GPUs Compute Capability NVIDIA Developer Ubuntu

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

Ubuntu Server 24.04 LTS

在文件的最后添加下面两行

输入下面的命令更新并重启

继续执行命令

将cuda工具包下载好后（不要盲目追求新版，平台会不适配），在驱动所在目录执行（选择安装选项中，默认选中安装显卡驱动）

设置全局环境变量

重启使生效，指令测试

将cuDNN下载好后，在所在目录执行

更新cuDNN时，在apt-get update前删除旧版，比如

Miniconda3安装脚本

注：download.pytorch.org不挂代理的话速度很慢。截至2025年3月22日，pytorch不加--index-url参数默认即 whl/cu124，所以可以去掉--index-url参数以事先设置好的全局国内源下载。实时具体情况可在Start Locally | PyTorch查看。

注：访问不了github的小伙伴可以在网上搜索github换源方法

开始安装

unsloth/DeepSeek-R1-Q4_K_M
ollama拉取后，在blob内找到最大的文件，添加后缀.gguf

注：

–optimize_config_path后面的文件夹位置相应换成你git clone ktransformers时的位置
The command args specifies how many cores to use (it’s ok that it exceeds the physical number, but it’s not the more the better. Adjust it slightly lower to your actual number of cores)

API兼容OpenAI和Ollama

测试每秒tokens在6-13tokens/s左右

小讯

AI编程实践：Cursor + Claude 上手教程与**实践

上一篇 2026-04-06 13:07

2026年苹果 Siri，AirPods+Watch 完美接入 GPT-5.1，这才是抬手即达的 AI 助理

下一篇 2026-04-06 13:05

AI编程实践：Cursor + Claude 上手教程与**实践 1773279931
2026年DeepSeek-V3 API接入指南：从零到一的完整部署教程 1773279911
2026年月之暗面科技发布Kimi长思考模型API：深度推理引领AI新潮流 1773279907
豆包大模型搭配AI书法工具设计字体教程 1773279891
AI编程超级工具Cursor与DeepSeek的结合使用教程 1773279887
claude code简易教程 1773279883
Android Studio接入科大讯飞语音听写SDK完整教程 1773279875
2026年实用指南：小白也能学会的大模型构建：DeepSeek实战教程+代码解析 1773279871
2026年亲测有效！一分钱不花，在Windows上完美运行AI编程神器Claude Code (保姆级教程) 1773279863
2026年苹果 Siri，AirPods+Watch 完美接入 GPT-5.1，这才是抬手即达的 AI 助理 1773279939
重度Cursor用户最强 Cursor Rules 和 Cursor 配置 mcp 以及**实践配置方式 1773279943
2026年豆包大模型1.6发布，AI云原生全栈服务升级 1773279947
Cursor中文界面设置教程 1773279955
2026年Prompt构造技巧：如何写一个有效的Midjourney Prompt 1773279959
2026年阿里千问正式推出最新旗舰推理模型Qwen3-Max-Thinking 1773279963
全面超越OpenAI和Claude！字节开源UI-TARS-1.5-7B：7项基准刷新SOTA，一键接管你的电脑和手机 1773279967
2026年VSCode Cline Claude 4.0集成指南：2025最全教程 1773279971
2026年Claude Code & 智谱GLM-4.6 环境配置指南 (Windows／macOS／Ubuntu) 1773279975

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/220636.html