2026年龙虾系列--openclaw基于昇腾910B单卡完成GLM-4.7-flash模型的加载并推理成功

科技前沿 • 2026-03-27 13:34 • 阅读 1

龙虾系列--openclaw基于昇腾910B单卡完成GLM-4.7-flash模型的加载并推理成功安装 node js curl o https raw githubuserco com nvm sh nvm v0 40 1 install sh bash source bashrc nvm install 22 校验 node js 版本 node v npm v 安装龙虾命令 npm install g openclaw latest openclaw

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

安装node.js

curl -o https://raw.githubusercontent.com/nvm-sh/nvm/v0.40.1/install.sh |bash

source ~/.bashrc

nvm install 22

校验node.js版本

node -v

npm -v

安装龙虾命令：

npm install -g openclaw@latest

openclaw –version

根据向导，配置openAI大模型的接口，命令如下：

openclaw onboard –install-daemon

打开网页http://10.23.45.123:18789 （IP为服务器网络地址）

网关令牌：通过配置文件.openclaw/openclaw.conf查看 auth.token 字段

接入权限设置：查看终端接入请求，命令如下

openclaw devices list

审核终端接入请求，命令如下

openclaw devices approve 32496f3faffe7beb356aa7 # device id

openclaw界面登录

昇腾skills安装包地址：

下载skills安装包并解压到路径/root/.openclaw/ascend-skills，打开聊天，输入安装命令如下：

检查路径/root/.openclaw/ascend-skills，并安装skills技能

列举当前技能

下载模型权重，命令如下：

下载模型权重ZhipuAI/GLM-4.7-Flash，保存到本地路径 /root/autodl-tmp/GLM-4.7-Flash

权重下载时间较长，会发生Agent执行超时现象，需要重新刷新页面，输入上面命令

指定安装软件版本，可以有效减少token消耗和skills处理时间

安装cann 版本 8.5.0

安装cann-910b-ops 版本 8.5.0

安装nnal 版本 8.5.0

安装vllm 版本 0.17.0

安装vllm-ascend 版本 0.17.0rc1

安装transformers 版本 5.3.0

安装torch 版本2.9.0

安装torch_npu 版本 2.9.0

使用vllm-ascend技能移植模型：

龙虾自动进行环境检测：

根据依赖告警发现版本冲突

校验模型下载地址

提供两种启动方式

选择2 运行离线推理测试，模型地址: /root/autodl-tmp/GLM-4.7-Flash

发现模型加载显存不足，优化启动参数

调用工具查看硬件显存，并修改启动脚本glm4_offline_inference.py中上下文长度，重新加载模型

加载显存失败，提供优化方式

提供模型量化和cpu offload方案，结论发现vllm-Ascend 对此模型支持部完整，尝试transformers直接推理

发现vllm不支持cpu offload，针对模型进行量化

安装量化工具msmodelslim

创建模型量化脚本

网络中断，重新加载问题，尝试transformers加载模型

部分权重offload到cpu，成功加载模型并推理，但是输出有问题，调整生成参数

最终输出结果

手动验证执行脚本：

模型加载权重分布，从权重45层开始，offload到cpu上执行

总结内容如下：

小讯

2026年即梦AI批量生成设置与教程

上一篇 2026-03-27 13:35

2026年AI驱动的科研自动化：n8n、Groq与学术API的融合应用

下一篇 2026-03-27 13:33

2026年即梦AI批量生成设置与教程 1774608275
winhex恢复RAW移动硬盘教程，win10硬盘raw格式修复 1774608231
2026年u盘装麒麟系统卡在boot 1774608183
2026年财达证券涨0.63% 1774608137
2026年Cursor AI编程实战：如何用自定义模式打造专属开发助手（附规则模板） 1774608113
财报解读：2025年的商汤，被遗忘的优等生？ 1774608047
加了硬盘不显示，加了硬盘不显示怎么办 1774608000
2026年Everything Claude Code 教程 3：编辑器集成 - Zed ／ VSCode ／ Cursor **实践 1774607953
2026年“Claude版龙虾”来了！；千问加入玄铁RISC-V无剑联盟｜蓝媒GPT 1774607930
2026年AI驱动的科研自动化：n8n、Groq与学术API的融合应用 1774608344
2026年手機也能寫程式？Claude Code Channels 遠端操控 AI Agent 全攻略 1774608366
腾讯2025 年财报深度解读：增长依旧强劲，市场在害怕什么？ 1774608412
2026年让Claude连跑6小时：Anthropic多智能体框架完整拆解 1774608439
2026年TikTok新手必备的“海外真实环境”深度伪装指南 1774608458
2026年AgenticHub × OpenClaw：把你的 Agent 装进龙虾 1774608481
2026年OpenClaw 多智能体协作部署指南 1774608529
项目分享｜agent-browser：Vercel开源的AI智能体浏览器自动化CLI工具 1774608576
昨晚，OpenClaw大更新，亲手终结「旧插件」时代 1774608600

版权声明：本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请联系我们，一经查实，本站将立刻删除。
如需转载请保留出处：https://51itzy.com/kjqy/249072.html