3 月 24 日,Anthropic 宣布了 Claude Computer Use 功能的重大升级。升级后的 Claude 代理不仅能理解屏幕上的内容,还能像真人一样操作鼠标和键盘——打开应用、点击按钮、填写表单、在多个应用间切换,自主完成跨应用的复杂工作流。
据 CNBC 报道,这次升级标志着 Anthropic 正式从"对话 AI"转向"行动 AI"的战略方向。Claude 不再只是回答问题的聊天机器人,而是一个能够真正代替人类操作电脑的数字员工。
Claude 的 Computer Use 经历了三个阶段的演进:
第一阶段(2024年10月):首次发布 Computer Use 测试版,Claude 可以看到屏幕截图,但操作精度低、速度慢,更像是实验性质的技术预览。
第二阶段(2025年):集成到 Claude Agent 中,可以通过 API 调用执行简单的浏览器操作,但仍然局限在特定场景。
第三阶段(2026年3月):全面升级。Claude 现在可以:
- 在多个桌面应用之间无缝切换
- 理解复杂的 UI 布局和嵌套菜单
- 处理弹窗、对话框和确认提示
- 执行拖拽、滚动等精细操作
- 在 Excel 中填写表格、在浏览器中预订机票、在邮件客户端中撰写和发送邮件
Anthropic 在发布会上展示了几个令人印象深刻的场景:
差旅预订:用户只需说"帮我预订下周三从上海到北京的机票,下午出发,经济舱,最便宜的",Claude 会自动打开浏览器、登录携程或飞猪、搜索航班、比价、填写乘客信息,最后等待用户确认付款。
数据录入:从 PDF 发票中提取信息,自动填入 Excel 表格或企业 ERP 系统。这种重复性的数据搬运工作以前需要人工花费数小时,现在可以在几分钟内完成。
跨系统操作:在 CRM 中查询客户信息 → 在邮件中撰写回复 → 在日历中创建跟进提醒 → 在项目管理工具中更新任务状态。四个应用、八个步骤,一条指令完成。
有趣的是,Claude Computer Use 的很多能力与 OpenClaw 的设计理念高度重合:
相似之处:
- 都强调 AI 代理的"行动能力"而非单纯对话
- 都支持跨应用操作
- 都需要用户授权才能执行敏感操作
关键差异:
- 操作方式不同:Claude 通过"看屏幕 + 操作鼠标键盘"来控制电脑(类似人类远程桌面),而 OpenClaw 通过 API 和命令行直接与系统交互(更快、更精确)
- 架构不同:Claude Computer Use 是 Anthropic 的商业服务,需要将屏幕截图发送到云端分析;OpenClaw 完全在本地运行
- 生态不同:OpenClaw 有 22000+ 社区技能,通过插件扩展能力;Claude 依赖通用的屏幕理解能力
Anthropic 的这次升级释放了一个重要信号:AI 代理的竞争焦点正在从"谁的模型更聪明"转向"谁能更好地与现实世界交互"。
无论是 OpenClaw 的命令行 + API 方式,Manus 的 My Computer 桌面操作,还是 Claude 的 Computer Use 屏幕控制,本质上都在解决同一个问题——让 AI 从"对话框"中走出来,真正成为能做事的助手。
对于开发者和企业来说,这三种方案可以根据场景互补使用:
- 标准化流程(如 API 调用、自动化脚本)→ OpenClaw
- 需要 GUI 操作的遗留系统(如没有 API 的桌面软件)→ Claude Computer Use
- 个人日常任务(如文件整理、日程管理)→ Manus Desktop 或 OpenClaw
2026 年 Q1 即将结束,AI 代理赛道的竞争强度已经超过了很多人的预期。接下来的 Q2,我们或许会看到更多意想不到的玩家入场和技术突破。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/249515.html