一直忙着做公司的项目,难得过年放假有时间,赶紧实战一下OpenClaw,其自动化、可执行等颠覆性的智能体功能,近期内在科技圈大火,其公布两个月就在Github上收到150k的Star。我用了三天时间详细分析了OpenClaw到底是个啥?能干什么?为什么这样设计?以及怎么部署一个本地自己的OpenClaw机器人,原理梳理和亲自实操了一遍,感觉效果确实不错。
01、OpenClaw是什么?
OpenClaw 的诞生源于一个激进的实验。项目创始人 Peter Steinberger(知名PDFSDK 提供商PSPDFKit的创始人)在退休后,试图验证“在不亲自编写代码的情况下,仅凭自然语言交互能否构建复杂系统”。其希望能够创建一个能够深度访问本地文件系统、管理个人账号、且数据完全受控的“私人数字管家”,以此回应日益封闭的 AI 生态。本着这个初衷,期间项目经历了三次关键更名:最初为致敬Claude大模型取名Clawdbot,因收到Anthropic商标异议邮件于2026年1月底改为Moltbot,后又因发音不顺和社交媒体账号问题,最终定名OpenClaw。这段命名波折,看得出来Anthropic也太没有格局,但也顺便助推了一把OpenClaw。
在改名过程中,Peter遭遇了加密货币黄牛的狙击——在两个浏览器窗口之间操作,仅5秒钟的间隔,旧账号就被黄牛抢走,用于推广代币和散布恶意软件。他一度想过直接删掉整个项目,最后靠着GitHub、Twitter的朋友们全力帮忙,花费10K美金买下Twitter商业账号,才把OpenClaw这个名字稳住。
大佬本人
Peter Steinberger是一位来自奥地利的资深软件工程师,同时也是一位连续创业者,他的技术生涯特别有亮点,实现了从移动端底层专家,到AI Agent领域先锋的巨大跨越,一步步走到现在,全靠扎实的技术功底。
他早期的时候,主要靠iOS和C++开发出名,算是这个领域的顶尖高手。后来他白手起家,创办了PSPDFKit——这家公司在PDF SDK领域是行业领先的,最后也成功出售了,算是非常成功的创业经历。在Objective-C/Swift运行时架构,还有高性能渲染引擎这些专业领域,他的造诣特别深厚,不是普通开发者能比的,底子打得极其扎实。
直到2025年,他复出之后,就彻底转型了,全身心投入到AI开源领域,还积极倡导两个核心理念:“Agentic Engineering”(也就是代理工程)和“Vibe Coding”。之后他就开发了Moltbot这类本地AI助理工具,核心就是探索一种新的生产力模式——从以前咱们程序员“手写每一行代码”,变成“指挥AI去编程”,大大提升开发效率。现在的他,已经是AI辅助开发领域里标志性的人物了,很多开发者都跟着他的思路探索新方向。
这里补充一点,这也是最近Mac Mini特别火爆的原因之一。因为最开始的Moltbot(也就是现在的OpenClaw)的许多底层依赖,都是基于Swift开发的,而且开发时主要聚焦在Apple生态,所以用Mac Mini部署Moltbot,能最大程度释放它的全部能力,不用额外适配,用起来也更顺畅,真的是太省心了,也不用浪费时间在兼容调试上。 关注公众号【阳光宅猿】回复【AIGC】领取最新AI人工智能学习资料,包含RAG、Agent、深度学习、模型微调等多种最新技术文档等你来选!! 关注公众号【阳光宅猿】回复【加群】进入大模型技术交流群一起学习成长!!!
OpenClaw 最具破坏力的创新,在于它不仅拥有独立的 Web UI,直接寄生于用户最常用的社交软件(Telegram, WhatsApp, WeCom)之中。这不仅是 UI 的改变,更是交互逻辑的革命
02、OpenClaw原理结构
图片源于网络(侵删)
OpenClaw核心目标很简单,就是把强大的推理模型和本地执行环境深度融合,让普通用户也能拥有 7×24 小时在线、有长期记忆、能自主操作电脑的数字员工,不用再盯着电脑做那些繁琐的事。
网关是整个系统的中枢神经。无论有多少个客户端设备(节点),它们都必须连接到这个唯一的 “大脑” 才能工作。同时也是整个系统的控制核心,主要负责对接WhatsApp、Telegram等多渠道消息接入,还管会话管理、路由分发、鉴权和状态监控,全程以后台服务常驻运行,保证消息和指令流转不中断、不卡顿,不用手动启动。作为一个长时运行的进程部署在用户可控的服务器或个人电脑上。其主要职责包括:
连接与路由:作为所有通信的入口,负责连接WhatsApp、Telegram、Discord等多种聊天平台,接收用户指令。同时,它内部的路由引擎(Routing Engine)会根据预设规则决定将消息分发给哪个智能体进行处理。
会话管理:维护与不同用户和平台的会话状态,确保上下文的连续性。
指令分发与状态同步:将解析后的指令分发给相应的智能体或节点执行,并负责同步任务的执行状态,将结果反馈给用户。
我给你一个更通俗、好记、一听就懂的生活化例子,完全对应 OpenClaw Gateway 的逻辑:
你家小区里有很多户人家、很多设备、很多入口,但所有事情都必须先经过中控室。
1、Gateway = 小区中控室
2. 各种聊天软件 = 小区的不同大门
= 一个小区只配一个中控室安全、好维护、不混乱、不出错。
OpenClaw 的 Gateway 就是整个系统的「总调度中心」。所有消息先到它这里,它再派 AI 去干活;你关了界面,中心还在运转,AI 也还在工作。
2.2、OpenClaw的智能体(Pi Agent)
PiAgent智能体是OpenClaw的 “大脑”,主推理、主执行。核心是对接大模型,解析用户真实意图,制定具体任务计划,调用各类技能和工具完成操作。同时搭配沙箱隔离机制,能有效保障执行安全,避免误操作损坏电脑里的文件或系统。
为啥这里采用PiAgent呢?它与其他AI Agent(如Claude Code、Cursor、Cline等)最大的不同,在于其独树一帜的极简主义设计哲学。为了更直观地理解,我把Pi Agent和其他主流Agent的特点整理成了一个对比表格:
Pi Agent的工具定义是“即时加载”的——这意味着系统提示词中只放工具目录,模型选中后才加载具体定义。这种设计与OpenClaw的技能按需加载机制一脉相承,大幅节省Token开销。
Flask/Jinja的作者Armin Ronacher在一篇推荐Pi agent的文章中提出了一个核心观点:只要有智能(模型),软件就像粘土一样是可塑的。没有必要事先配置好各种确定的Skills,需要的时候让Agent自己开发,开发出来有问题可以修改,直到可用。只要给智能核心包一个薄薄的壳,Agent就能成为一种动态生长的软件。Pi agent正是这一理念的完美体现——它把核心做得极小,但允许能力“长出来”。这种“核心极小,但能长出来”的设计哲学,与OpenClaw的Skill系统天然契合。
关注公众号【阳光宅猿】回复【AIGC】领取最新AI人工智能学习资料,包含RAG、Agent、深度学习、模型微调等多种最新技术文档等你来选!!
关注公众号【阳光宅猿】回复【加群】进入大模型技术交流群一起学习成长!!!
2.3、工具(Tools)和技能(Skills)模块
工具(Tools)和技能(Skills)模块是Moltbot的能力扩展层,就像给手机装 APP,以插件和脚本形式存在,能提供文件操作、浏览器自动化、系统命令执行等基础原子能力。想加新功能直接扩展技能就行,不用改动核心架构,灵活度拉满,完全不浪费时间。
工具其整合了自动化与调度工具CronJob、Hooks,硬件感知工具Location定位工具、Voice Wake/Audio语音工具、Camera Capture摄像头工具,浏览器与网络工具Managed Browser自托管浏览器、Chrome Extension浏览器扩展插件,系统执行与编程工具ExecTool、BackgroundExec后台进程管理工具、apply_patch Tool。
在OpenClaw的架构,如果说Tools(工具)是AI的“手和眼”(如浏览器、摄像头),那么Plugins(插件)和Skills(技能)就分别代表了它的“耳朵/嘴巴"和”职业专长”。这两者共同扩展了OpenClaw的边界,但侧重点完全不同:插件主要用于扩展网关的连接能力,而技能主要用于扩展Agent的任务逻辑。
插件运行在 Gateway(网关) 层,主要用于增加 OpenClaw 支持的新通信协议或底层功能。它解决的是“OpenClaw 能在哪里说话”以及“能处理什么样的新信号”的问题。
技能运行在Agent(智能体)层,通常是一组预设的逻辑、提示词(Prompts)或特定工作流的集合。它解决的是“OpenClaw 擅长做什么工作”的问题。
Skill 是对基础 Tools 的高级封装。OpenClaw为我们提供了ClawHubSkill集合网站。
这是 OpenClaw 的技能市场或中央仓库,用户可以在这里下载或分享社区构建的技能。
在OpenClaw的世界里,技能(Skill)可以理解为AI的“双手”——它是一套封装了专业知识、工作流程和执行逻辑的模块化能力包。如果把OpenClaw本体比作“操作系统内核”,那么大模型是“大脑”,而技能就是安装在系统上的各类“应用程序”。没有技能,OpenClaw只能聊天;装上技能,它才能真正“干活”——比如发邮件、查天气、操作浏览器、处理文件。
技能的载体:就是一个文件夹,文件夹里必须包含一个“SKILL.md”文件。这个文件用Markdown格式(普通人能读懂的文本格式)告诉AI:这个技能是做什么的、什么时候该用它、具体怎么操作。如果需要执行具体代码,还可以在同目录下放“agent.py”(Python脚本)或“index.ts”(TypeScript脚本)。
技能(Skill)规范由Anthropic公司于2025年12月18日正式发布为开放标准。需要明确的是,技能与MCP(模型上下文协议)是两个独立且互补的技术——MCP解决的是“AI可以访问什么外部资源”(连接数据库、API等),而技能解决的是“AI应该怎么用这些资源”(操作流程、**实践)。两者可以协同工作。
OpenClaw对技能规范进行了深度工程化实现,形成了一套完整的“技能生命周期”管理体系。
1. 技能存在哪里?——发现机制
OpenClaw会在多个目录中扫描技能,并按优先级从低到高合并(同名技能高优先级覆盖低优先级):
2. 哪些技能能用?——过滤机制
发现技能后,系统会进行严格筛选:
只有通过过滤的技能才会进入最终可用列表。
3. 怎么告诉AI有哪些技能?——按需加载
这是OpenClaw最聪明的设计。系统提示词中只放入技能的目录信息(名称+简短描述+文件路径),而不放入完整的“SKILL.md”内容。这就像给AI一个“菜单”而不是“菜谱”——先看菜名决定想吃什么,选中后再看具体做法。
模型在判断需要使用某个技能时,会调用“read”工具读取对应的“SKILL.md”文件,再按其中说明执行。这种按需加载机制避免了将所有技能文档一次性塞入上下文,大幅节省Token开销。
4. 技能长什么样?——SKILL.md规范
一个典型的“SKILL.md”包含两部分:
第一部分:元数据头(YAML格式)
第二部分:自然语言描述
5. 怎么调用技能?——两种触发方式
方式一:AI自主调用(模型侧)
模型在系统提示中看到技能列表,根据用户请求判断是否需要调用某个技能,然后读取对应的SKILL.md并按说明执行。
方式二:用户直接触发(斜杠命令)
在Telegram、Discord、Slack等渠道,用户可以直接输入“/技能名”来触发技能,无需经过模型推理。如果技能配置了“command-dispatch: tool”,斜杠命令会直接调用对应工具执行;否则系统会将用户输入改写为“使用某技能”的提示,走正常回复流程。
6. 怎么安装新技能?
- 从ClawHub安装:clawhub install 技能名称(ClawHub是官方技能市场,收录3000+技能)
- 手动创建:在“/.openclaw/skills/”下新建文件夹,编写“SKILL.md”
OpenClaw并非技能规范的创造者,但其工程实现有三个核心创新点:
2.4 OpenClaw的记忆模块
记忆模块是本地持久化存储层,采用简单的文件格式,如JSONL和Markdown,来持久化存储会话记录、用户偏好、长期知识等记忆内容。这种设计的优点是透明、易于人类理解和编辑,并且便于版本控制和备份并结合时间戳、关键词和向量检索,支持向量检索和关键词匹配等多种方式,使得智能体能够根据当前上下文快速、准确地从记忆库中找到相关信息。实现跨会话的长期记忆。最关键的是所有数据都不上云,全存在自己的电脑里,隐私完全自主掌控,不用怕数据泄露。
将长期记忆存储为本地文件系统中的Markdown文档(即MoltBook)。Agent的记忆不是隐藏在向量空间里的抽象表示,而是一组清晰可见的Markdown文件:摘要、日志、用户画像都以结构化文本形式存储在磁盘上。
通俗理解:其他AI的记6忆像是一个“黑箱笔记本”——你只能问它还记得什么,但看不到笔记本上具体写了什么。OpenClaw的记忆则像是一个“透明文件夹”——里面全是txt文件,你可以随时打开看,甚至用记事本修改。
OpenClaw的设计哲学:这种“白盒记忆”为人机协作提供了一个最低但关键的信任基础。用户可以直接查看Agent(智能体)记录了什么、是如何描述自己的需求,也可以在发现偏差时手动修正,而不必理解数据库结构或检索逻辑。向量索引最多只是检索加速层,而不是记忆本体。为了解决本地多任务并发可能导致的文件写入冲突,OpenClaw引入了 “泳道队列”(Lane Queue)系统,强制任务串行执行,确保记忆写入的准确性。
2.5 OpenClaw的节点模块
节点是OpenClaw 执行能力的物理延伸,它们是分布在各种终端设备(如个人电脑、手机等)上的代理程序。节点的作用是提供硬件能力和本地执行环境,使得OpenClaw能够超越云端API的限制,与用户的物理世界和本地数字环境进行交互。
节点提供的能力包括:
03、OpenClaw应用场景
OpenClaw最区别于传统Agent的地方就是它能真正自我决策,自我执行、自我判断并不受平台限制的解放双手的智能体。像豆包只会给你方案,OpenClaw会直接用你电脑上的系统、文件、软件自己操作,比如打包你图片家里的图片,发送邮件,打开编程软件进行编程,用你的作图工具帮你作图,不是给你答案,而是进化到了帮你做,重点在做这一步,你自己不用亲身再去打开工具之类操作之类的了,而且做只需要你给他指令,不需要复杂的代码开发和工具引入。
OpenClaw中的用户不再只是与一个机器人对话,而是将OpenClaw作为“指挥官”,可以调度一个由“多个专门Agent”组成的团队,使其操控多个Agent一起自动化流水线形式执行。同时还可以整合智能家居并与硬件深度集成,实现软硬件互通可控。有网友分享了其通过配置OpenClaw来操控小区门开关的例子。
OpenClaw还可以构建全能型移动开发与运维中心,这是目前最硬核且高价值的用法。用户不再依赖电脑,而是通过手机上的聊天软件指挥 OpenClaw 完成复杂的软件需求开发和运维任务。
国内很多云厂商已将OpenClaw部署在服务器上,自主检查构建失败的日志,识别错误(如构建命令错误),修复代码,并重新部署,甚至在用户遛狗时通过语音完成这一切。有厂商已经给OpenClaw整合了1000多个垂直领域数据库,能够实现金融数据分析、股票行情监控。
目前的OpenClaw已经从单一的聊天机器人进化为个人生活的操作系统。其核心价值在于“连接”——它连接了代码库、日历、笔记软件、智能家居、浏览器等。
04、Linux Unbuntu LTS部署OpenClaw
WSL2 是 Windows Subsystem for Linux 2 的缩写,顾名思义,它是一个允许你在 Windows 系统中直接运行完整的 Linux 操作系统环境(比如Ubuntu系统)的工具,而无需传统的虚拟机。出于系统架构与兼容性考虑,以及方便安装后台守护进程,Windows的同学需要提前安装好WSL2。
理解OpenClaw的最好方式,是亲手跑一遍。本节将详细拆解从环境准备、安装部署、Skill扩展,到真实用例的全流程。
部署前的核心准备
硬件配置建议
OpenClaw对硬件有一定要求:
软件环境依赖
LinuxUbuntu搭建Docker环境可以参考如下链接: https://blog.csdn.net/xubass/article/details/ LinuxUbuntu搭建Node.js环境可以参考如下链接: https://blog.csdn.net/weixin_/article/details/
OpenClaw最新版本OpenClaw 2026.2.19-2安装,快速安装命令:
如果不存在curl则执行以下命令安装curl。
具体操作步骤和日志
这里如果没有安装以上环境OpenClow会自动安装其匹配的nodegit等所需环境组件。
这里OpenClow官方给出了安全警告内容:
并且新增了很多模型厂商,国内完全免费且较为稳定的是Qwen App的接口,即调用千问的App来进行对话。这里我们选择MiniMax,因为Qwen没有弹出授权页面,因此不得不选择其他模型。
这里需要说明的是,如果要选择其他免费模型,就需要在选择模型供应商部分先选择Skip for now,这里我们暂时选择Skip for now。因为我们选择Qwen模型,应该会自动弹出授权页面,如果没有注册,还会提示先进行注册再授权,然后点击确认即可完成授权,但是其并没有弹出授权页面。
注意如果这步你选择了Qwen但是没有弹出授权页面,会导致网关GateWay授权失败。
关注公众号【阳光宅猿】回复【AIGC】领取最新AI人工智能学习资料,包含RAG、Agent、深度学习、模型微调等多种最新技术文档等你来选!!
关注公众号【阳光宅猿】回复【加群】进入大模型技术交流群一起学习成长!!!
我们可以执行后面的卸载命令进行卸载重装。
继续上一步,我们选择MiniMax中的MiniMax M2.5作为默认模型。MiniMax也是OpenClaw作者推荐的适合国内小伙伴使用的,填入我们申请的APIKEY(目前MiniMax新用户注册赠送15元代金券)。
如果前面选择Skip for now,然后就能看到现在OpenClaw各免费模型的名字,大家可以任意选择,也可以选择比如kimi-coding模型,然后选择kimi-2.5模型作为默认模型。
不管怎样,选择完模型之后,即可进一步选择channel,也就是选择允许接入的即时通信软件。目前国内支持的比较好的只有iMessage,但应用面不广,下一步我们通过插件直接接入企微和飞书, 因此这里我们先选择跳过。
Skills选择我们也先跳过。
然后我们选择让模型能够进行会话级的长期记忆。
而当安装结束后,即可选择对话方式,这里我们选择TUI,即同步命令行和Web页面内容进行对话。但是这里提示网关连接异常。
根据官网给的方法
我们访问页面http://localhost:18789/chat,将openclaw config get gateway.auth.token 出来的token粘贴到Gateway Token输入框中,点击连接显示正常。
这样我们即可进入到对话页面,首次登陆时会自动给OpenClaw发送一条Wake up,my friend信息, 能够看到模型即时回复的消息。
如果期间我们想要更改模型的APIKEY或者是更换模型,需执行一下命令:
我在这里修改了模型的APIKEY,改为直接读取配置文件/.openclaw/openclaw.json中的APIKEY内容。
控制台输入/models,选择好minimax模型Minimax-M2.5。
重启OpenClaw配置即可生效。
05、卸载OpenClaw
要卸载使用 pnpm 全局安装的 openclaw,可以使用以下命令:
或者也可以使用更简短的写法:
如果以上命令不行,可以尝试:
检查是否已卸载:
手动删除全局包(如果标准方法无效):
找到pnpm全局安装目录
然后进入该目录手动删除openclaw相关文件夹
清除缓存(可选):
注意事项:
-g 参数表示全局(global),与安装时使用的 -g 对应
如果安装时使用了 –global 完整写法,卸载时也可以使用同样的完整写法
卸载完成后,可以通过以下命令验证是否成功:
06、OpenClaw基础命令汇总
简单命令操作汇总:
关注公众号【阳光宅猿】回复【AIGC】领取最新AI人工智能学习资料,包含RAG、Agent、深度学习、模型微调等多种最新技术文档等你来选!!
关注公众号【阳光宅猿】回复【加群】进入大模型技术交流群一起学习成长!!!
07、OpenClaw工作流程
我们可以把 OpenClaw 比作一个公司员工:
一个典型的OpenClaw任务执行流程如下:
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/214284.html