整体 → 核心组件 → Agent Loop → 多Agent系统
OpenClaw本质上是一个 本地运行的 AI Agent 操作系统(Agent Runtime)。
传统 AI:User -> API -> LLM -> Response
OpenClaw:
关键思想:LLM只是大脑,Agent系统负责身体。也就是 Brain (LLM)+Body (tools + memory + runtime)=Agent。
OpenClaw强调:本地运行、持久状态、工具执行、事件驱动、多Agent系统 (MMNTM)
完整架构可以拆成 六层:
这是 OpenClaw 最核心组件。它是一个 长期运行的 Agent Runtime Server。
职责:管理 agent 生命周期、路由消息、管理 session、调用模型、调用工具、管理 memory
技术实现:Node.js、WebSocket、Event Loop、Plugin Middleware
系统架构:
特点:WebSocket 双向通信、多Agent调度、Session管理、Plugin pipeline。官方称为:Core Gateway Control Plane (OpenClaw Community)
Agent Core负责 Agent Loop(Agent大脑)。
核心流程,也就是经典 ReAct Loop:
Agent Core负责:prompt构造、tool calling、planning、reasoning、session state
每个 Agent 有独立配置:agent_config、system_prompt、model、tools、channels、memory
因此:一台机器可以运行 多个Agent。 (OpenClaw)
Agent长期记忆,OpenClaw有三种 Memory:
1.短期记忆
类似聊天上下文,recent_messages、conversation_history,通常存在 session cache。
2.长期记忆
保存用户信息、任务结果、经验总结;技术实现 embedding、vector search、hybrid search;支持 semantic retrieval、chunking、memory compaction。
3 Agent知识
类似knowledge base、documents、files、notes;很多实例直接存在 markdown files;Agent通过 semantic search 检索。 (MMNTM)
Agent执行能力,Agent本质上是 LLM + Tools;
OpenClaw默认四个核心工具:read、write、edit、bash,即读文件、写文件、编辑代码、执行命令;典型任务 写代码、修改代码、执行脚本、运行测试、部署;这是 Claude Code / OpenDevin / Devin 类 Agent 的核心模式。 (Agentlas)
插件生态,OpenClaw有 5700+ skills (OpenClaw)
Skill 本质是 function + metadata;例如 send_email、search_web、read_calendar、book_flight、post_twitter;Agent调用 tool_call;Skill通过 plugin middleware 运行。
例如:
OpenClaw内置Headless Chrome,通过 Chrome DevTools Protocol (CDP) 实现点击、输入、滚动、截图、抓取DOM,能力包括自动填表、自动登录、自动抓数据、自动操作网站。这就是 Agent 做 真实任务 的关键能力。 (OpenClaw Community)
架构:
OpenClaw还能控制设备:iOS——XCUITest、Android——ADB,支持点击、手势、屏幕镜像、自动操作App。这就是所谓 Agent Control Layer。
OpenClaw不是简单聊天系统。它是事件驱动系统。Agent输入来源有 5 种:Message、Heartbeat、Cron、Hook、Webhook。例如:
Message:用户输入。
Heartbeat:Agent周期思考——例如每5分钟检查任务
Cron:定时任务——每天9点发邮件
Hook:系统事件——新文件创建
Webhook:外部触发——GitHub PR、Stripe支付。本质是 Event → Agent → Action
OpenClaw把 Agent persona 拆成三层:
1.SOUL.md——Agent哲学:价值观、思维方式、原则
2.IDENTITY.md——Agent表现:说话风格、角色、语气
3.openclaw.json——Agent能力:tools、models、permissions;类似:人格 / 表现 / 能力。这种设计在 Agent 框架里非常少见。 (MMNTM)
OpenClaw可以运行 Agent团队。例如:
CEO Agent
│
├─ Research Agent
├─ Coding Agent
├─ Marketing Agent
└─ QA Agent
消息流:
核心原因:
1.本地 Agent OS——不是API wrapper。
2.Agent Runtime——持续运行。
3.工具执行能力——可以写代码、运行代码、浏览网页、自动化工作
4.多Agent系统——可以做Agent团队
Agent = Event Loop + Memory + Tools + LLM
或者:Agent OS =Gateway + Agent Runtime + Memory + Tool System + Event System
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/229418.html