本系列第二篇:深入“龙虾”大脑——拆解四层架构,理解 Agent 的 ReAct 循环与核心执行逻辑
在上一篇文章中,我们认识了 OpenClaw 的本质定位——从“能说”到“能干”的 AI 执行中枢。但一个好工具,光知道它“能做什么”还不够,真正重要的是理解它“怎么做”。这不仅能让你用得更顺手,更能帮你规避潜在风险,甚至基于架构进行二次开发。
这篇文章,我们将从微观层面深入 OpenClaw 的底层设计。看完它,你就能清楚地回答:当你对 AI 说了一句“帮我整理桌面”,消息在“龙虾”体内经历了什么、每一步是谁在执行、背后的逻辑是什么。
一、架构总览:四个视角看 OpenClaw
在正式展开之前,我们先建立一张“认知地图”。理解 OpenClaw 的架构,可以有四种不同层次的视角,分别对应不同的关注深度:
视角一:四层逻辑架构
OpenClaw 采用分层架构设计,从宏观职能上分为四个逻辑层级:
- 模型层(Model Layer) :智能体的“大脑”。负责理解用户指令的真实意图,进行逻辑规划和任务分解。这一层实际调用的是外部大模型(如 GPT、Claude、DeepSeek)。
- 技能层(Skills Layer) :智能体的“双手”。提供具体的执行模块和工具,让 AI 能够读写文件、运行命令、搜索网络等。
- 工作流层(Workflow Layer) :智能体的“神经系统”。负责编排多个技能,形成完整的任务执行链。
- 执行层(Execution Layer) :智能体的“身体”。确保任务在真实环境中落地执行,包括沙箱隔离、权限校验等。
这四层从抽象到具象、从决策到执行,构成了 OpenClaw 的完整能力链条。
视角二:四大核心组件
如果说四层架构是“职能分工”,那么Gateway、Agent、Skills、Memory就是具体的“执行单元”,也是本文要深度拆解的核心:
这四个组件协同工作,实现了从“用户输入”到“行动执行”再到“结果反馈”的完整闭环。
视角三:三层闭环架构
OpenClaw 还通过感知-决策-执行的三层闭环架构实现了系统级的协同:
- 感知层:接收多平台触发信号,统一消息格式,相当于系统的“眼睛和耳朵”。
- 决策层:Gateway 将用户输入交由 LLM 生成结构化指令,相当于系统的“大脑”。
- 执行层:依据指令调用对应 Skill 完成实际动作,相当于系统的“手脚”。
视角四:Hub-and-Spoke 中心辐射架构
从整体拓扑结构来看,OpenClaw 采用 Hub-and-Spoke(中心辐射)架构:
- Hub(中心) :Gateway 网关作为唯一的控制平面,是系统中的“单一事实源”(Single Source of Truth)。它统一管理所有消息渠道的连接、维护会话状态、协调各组件通信。
- Spokes(辐射端) :各类客户端(CLI、WebChat、macOS 应用、iOS/Android 节点)以及 Agent 运行时,都通过 WebSocket 连接到 Gateway,形成星型拓扑。
这种架构的优势在于状态一致性——与分布式多 Bot 方案不同,OpenClaw 的单一 Gateway 确保了用户身份的全局统一、会话状态的集中管理、安全策略的一致性执行。
接下来,我们逐一深入每个核心组件。
二、Gateway(网关)——“中枢神经”
2.1 定位:OpenClaw 的“大脑皮层”
Gateway 是整个 OpenClaw 系统的调度中枢和控制平面。它本身不提供模型能力,而是作为消息入口、控制平面与节点协调中心存在。
可以这样理解:Agent 负责“想”——思考如何解决问题;而 Gateway 负责“管”——管理谁在说话、从哪来、交给谁处理、结果怎么回去。
Gateway 默认运行在 http://127.0.0.1:18789(仅绑定本地回环地址),是一个长期运行的单进程守护进程。
2.2 Gateway 的四大职责
职责一:维护所有消息渠道连接
Gateway 统一管理超过 20 种通讯平台的连接,包括 WhatsApp(通过 Baileys 协议)、Telegram(通过 grammY 框架)、Slack、Discord、iMessage、Signal、飞书、钉钉等。它维护与每个渠道的长连接,确保消息能够实时收发。
职责二:暴露 WebSocket 控制平面
Gateway 对外暴露一个类型化的 WebSocket API,所有客户端(CLI、macOS 应用、Web UI、移动节点)都通过这个统一的 WebSocket 接口与系统交互。WebSocket 协议采用 JSON 格式的请求/响应帧,支持服务端推送事件。
职责三:会话与上下文管理
Gateway 是会话状态的集中管理者。无论是来自 Telegram 的私聊消息,还是来自飞书的群聊指令,Gateway 都会根据发送者的身份识别对应的会话,加载历史记忆,确保 AI 在不同渠道之间保持一致的“人格”和
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/252544.html