开源项目OpenClaw(“龙虾”)以惊人的速度风靡全球,引发科技巨头如腾讯、字节跳动等纷纷推出变种产品,催生“上门安装龙虾服务”现象。文章核心围绕OpenClaw的诞生及其“让AI动手”的定位展开,分析其如何通过脚本与工具调用,实现AI从“动嘴”到“动手”的突破。同时,对比了ChatGPT与Claude两大AI平台的战略演进,揭示OpenAI的“统一模型”路线与Anthropic的“分化”路线差异,以及MCP协议、Skill机制等技术进展对AI生态演进的影响。文章指出,AI的下一战场在于“执行层”,掌握连接AI能力与真实世界的“最后一公里”至关重要,未来将重塑互联网格局。
帖子很长,你可以跳着看,有时间线,后期,可能微软要出了,但不一定是叫claw
025年末,一个名为“OpenClaw”(俗称“龙虾”)的开源项目在GitHub上悄然诞生。
短短4个月后,这个项目斩获了超过25万颗星标,成为全球增长最快的开源项目之一,
引发腾讯、字节跳动等中国科技巨头纷纷推出变种产品,甚至催生了“上门安装龙虾服务”的社会现象。
有人在做“脑”,有人在建“手” 。
1.1 OpenClaw的诞生
奥地利开发者彼得·斯坦伯格(Peter Steinberger)是PDF工具PSPDFKit的创始人,一度对编程失去热情。
直到2025年4月接触Claude Code,这是一种AI编辑器(相当于Ide+ai)
仅用10天时间,彼得在2025年11月24日开发出了OpenClaw的前身——最初名为WhatsApp Relay,随后更名为Clawdbot。
“Clawdbot”这个名字暗藏玄机:它既谐音致敬了Anthropic的Claude模型(Claw + Claude),也融入了龙虾钳子(Claw)的意象,暗示着这个AI智能体能够像钳子一样牢牢抓住各种工具。
由于商标风险,项目经历了两次更名——Clawdbot → Moltbot → OpenClaw,
最终于2026年1月正式定名并开源。它采用MIT开源协议,完全免费、可自由修改与商用。(2026年4月14日 现在已进开源基金会)
作者也加入了Open ai。
1.2 核心定位:让AI“动手”,而不只是“动嘴”
OpenClaw之所以火。关键在于它解决了AI应用的一个根本痛点:大模型再聪明,也只能输出文字,无法真正“做事” 。
从架构层面看,OpenClaw本身是一种脚本使用ts+js 编写。核心部分在于它的细分脚本,例如打开浏览器,执行搜索。它首先会读取你的问题后,+ 系统指令(包含工具列表就是skill包(本质上是一个md文档,+脚本)) 一起给大脑看后,返回json (一种结构化格式的段落,类似.Md). 脚本就会识别特定的识别符,来调用脚本开始工作。(通常脚本内,或者工具列表会写入循环,如果不对可循环,)。 因为大模型可以生成脚本代码,只需要告诉它使用内置的python就可以自己写脚本自动运行。
因我写过这样的程序,这就是为什么烧词源的原因,它本质上是靠它训练的知识代码来写,也取决于脚本本身的质量。
下图为龙虾后台的系统指令表(表与表之间是关联)

里面你可以修改,他是谁,调用的工具路径。

这是我的一个名字的定义,这些都是可以随便修改的。 因为这个open claw 本身就是一个大脚本集合。它可以调用win,mac的系统指令来找到你的然和文件夹,使用Py来读取内容,然后发给云端AI.这样它就貌似像个可以工作的工具。核心还是脚本集 媒体喜欢用skill(这是因为是老外发明的东西,所以叫做技能)
逻辑链条
你可以把这个过程想象成“接力棒”:
- 用户 ightarrow
发出指令。
- 大脑 ightarrow
输出 JSON (指令:去查资料)。
- 脚本 ightarrow
执行操作 ightarrow 拿到资料。
- 脚本 ightarrow把资料喂回给大脑
(反馈)。
- 大脑 ightarrow
分析资料 ightarrow 输出 JSON (指令:写出报告)。
- 脚本 ightarrow
最终展示。
有了脚本技能包的加持,它能完成的任务包括不限于:管理日程 搜索数据,执行软件。
最核心的部分是它有一个心跳的模块,就是电脑上的定时,就像你的闹钟一样,到了点,脚本会自动给大脑发一个信息,然后大脑根据发的那个信息,返回数据,来执行。(那一条信息其实也是一个文档列表。就是告诉AI,现在应该执行什么动作。)
这是 这个工具的运作机制。
Note
不要迷恋AI agent 本质就是AI+脚本。这篇帖子,总体上会让你有洞察力看清这个领域。
ChatGPT,Claude gemini3 ,Qwen 文心 glm5 deepseek-v3 r1 还有视频大脑,视图大脑 非常多,不列举 (现在大模型都是多模态,意思就是可以识别文字,图片,视频,代码,推理 这叫多模态。)
以前的编辑器都是ide,后来出来AI了。一些公司就是开始制作编辑器+Ai,给自己用,后来就公开了,因为写代码的人都是程序员,他们知道自己造电脑工具。
open code 是开源Ai编辑器,目的是打破 Claude code 的垄断,因为是他先开始做的,他发明了mcp(也就是一种工具调用协议,你可以这么理解,就是这个格式咱们都这么弄,这里我没有去深入研究,我们不扣没用的。)
vs code 本质上不是AI 编辑器,他是集成开发环境ide,他跟 vs studio 系列 PyCharm PhpStorm 这类都是老牌,或者老式 写代码的工具。
多数人只知道。Claude code 有命令行 ,open code gemini3 他们都有。只是为了保留 最初的样子,是为了好开发测,所以保留了。没人用命令行 做事,除非他是傻子。
命令行的用途是为了 方便跑脚本。如果是带有界面的软件,就是Gui,你得写很多东西,脚本不知道按钮在哪里,提交在哪里。 一些外行up主自己不懂,不会 还说这玩意很先进。界面才是是先进的东西。命令行自电脑但是一开始就只有命令行。
日常选用,看自己喜好。这种Ai编辑器是让AI来帮你写代码使用的,当然也可以做一些文档整理的工作。但他不如通用的AI智能体,好用,后者技能包更多。 这些Ai 编辑器,没有技能包。因为他不是干这个使用的,虽然能自己做,但是很麻烦。
最大的好处就是可以 定时。放到云端(就是云服务器,也可以本地,也可以放在另外一台电脑上。他可以根据设定的任务流程自己工作,最后指定一个接收结果的地方。)
因为有了心跳的功能,他自己可以循环启动。也就说定期的检查那些定时任务有没有错误。
目前根据我的测试,能做到所有桌面电脑上工作。就连 ,微信这种封闭的环境,也可以靠图像识别来模拟人的操作。因为大脑现在都是可以识别图片的,脚本只需要按照步骤截图给模型看,看后判断,调用鼠标点击。
1.3 国内科技巨头入局:一场围绕“龙虾”的卡位战
OpenClaw的火爆迅速吸引了中国科技巨头的注意。2026年初,围绕“龙虾”展开了一场密集的产品卡位战:
OpenClaw(前身Clawdbot/Moltbot)
- 发布时间
:2025年11月(Clawdbot)→ 2026年1月(OpenClaw正式定名开源)
- 发布方
:彼得·斯坦伯格(开源社区)
- 核心定位
:自托管AI网关,将大模型转化为可执行任务的智能助手
- 关键特征
:MIT协议开源,免费商用,本地部署,GitHub 25万+星标
AutoClaw(澳龙)
- 发布时间
:2026年3月(随智谱合作推出)
- 发布方
:智谱AI
- 核心定位
:OpenClaw的一键安装桌面版
- 关键特征
:内置Pony-Alpha-2智能体模型,支持模型热插拔与飞书集成,50+技能开箱即用,“小白也能1分钟上手”
QClaw
- 发布时间
:2026年3月(3月18日版本升级,3月20日正式全量公测)
- 发布方
:腾讯电脑管家团队
- 核心定位
:基于OpenClaw封装的本地AI智能体,面向大众用户
- 关键特征
:首创微信直连(小程序控制电脑),20秒完成安装,零门槛免部署,用户通过向“龙虾”下达自然语言指令即可实现各类电脑操作
ArkClaw
- 发布时间
:2026年3月9日
- 发布方
:火山引擎(字节跳动旗下云与AI服务平台)
- 核心定位
:开箱即用的云上SaaS版OpenClaw
此外,英伟达在GTC大会上发布了“Nemo-Claw”开源栈,腾讯则官宣了包括WorkBuddy(腾讯版“免部署小龙虾”)、QClaw、腾讯云Lighthouse在内的全系“龙虾”产品矩阵。
1.4 战略意图:抢占“AI执行层”的入口
为什么中国科技巨头如此密集地布局OpenClaw生态?这背后反映了一个关键的战略判断:AI的下一个战场不是模型本身,而是执行能力。
OpenAI和Anthropic在做“最强的大脑”,但谁能让这个大脑真正操控用户的电脑、手机和应用,谁就掌握了连接AI能力与真实世界的“最后一公里”。OpenClaw恰好提供了一个开放、可扩展的执行框架,腾讯通过微信入口将QClaw变成“人人都能用的AI操作员”,字节跳动则通过云化部署将ArkClaw推向企业市场——每家巨头的打法不同,但目标一致:在“AI执行层”这个新战场上抢先建立生态壁垒。
如果说OpenClaw生态代表的是“AI如何动手”,那么ChatGPT与Claude的对决则代表了“AI如何思考”。两个产品走到2026年,各自的路线已经泾渭分明。
2.1 ChatGPT路线图:从通用对话到统一执行
OpenAI的战略演进可以概括为:从“聊天机器人”到“智能体操作系统” 。
关键节点:
- 2023年3月
:GPT-4发布,奠定了多模态和复杂推理的基础
- 2024年5月
:GPT-4o推出,以其“温暖亲切的对话风格”迅速获得用户喜爱,成为许多人的“最有感情”的AI助手
- 2025年4月30日
:GPT-4从ChatGPT中移除,由GPT-4o全面取代
- 2025年8月8日
:GPT-5正式发布。这是OpenAI“史上最强大的AI模型”,采用多层级架构,整合了o3系列的推理能力,重点提升了智能体能力。GPT-5不再追求颠覆式创新,而是主打“实用性和普及性”,CEO奥特曼称“这次最强调现实中的实用性以及普及性”
- 2026年3月5日
:GPT-5.4发布。这是OpenAI“能力N合1”的统一模型,集推理、编码、智能体工作流于一体,原生支持电脑操作,搭载100万token上下文,被官方定义为“迄今能力最强、效率最高的专业工作前沿模型”
- 2026年3月17日
:GPT-4.1 Mini和Nano发布,面向速度与成本效率优化
- 2026年2月13日
:OpenAI在ChatGPT中退役GPT-4o、GPT-5、GPT-4.1、GPT-4.1 Mini、o4-mini等一系列旧模型,标志着全面向新一代统一架构过渡
核心意图:OpenAI的战略是用一个“统一模型”覆盖所有场景。从GPT-5开始,模型不再需要用户手动选择“用哪个版本”——系统自动判断任务类型,在快速响应与深度推理之间动态切换。GPT-5.4进一步将这一理念推向极致:推理、编码、工具调用、电脑操作全部原生集成于一个模型之中。
2.2 Claude路线图:从“安全优先”到“混合推理”
Anthropic的路线则从一开始就带有鲜明的“哲学底色”:安全、可控、对用户价值观对齐。这种产品哲学在模型的迭代中一以贯之。
关键节点:
- 2024年10月
:Claude 3.5系列新增流程图与技术图纸解析能力,实现图像生成代码的跨模态交互
- 2025年2月
:Claude 3.7 Sonnet发布,成为全球首款混合推理模型。用户可通过API调控“思考预算”——既可以快速响应,也可以深度推理。知识截止日期为2024年10月,支持高达128,000 token的输出
- 2025年5月
:Claude 4系列正式发布,被Anthropic称为“史上最强大的AI模型组”
- 2025年9月30日
:Claude Sonnet 4.5发布,宣称“全球最出色的编码模型”,也是“构建复杂智能体的最强模型”,可自主运行长达30小时
- 2025年11月
:Claude Opus 4.5发布,在编码、智能代理和计算机应用方面达到新高度,“在深度研究、处理幻灯片和电子表格等日常任务方面显著优于其他模型”
- 2026年1月27日
:Claude 3.7 Sonnet、3.5 Haiku和3.5 Sonnet正式下架
- 2026年2月5日
:Claude Opus 4.6发布,被定位为“迄今最强版本”
- 2026年6月
:Claude 4系列新模型将向微软、亚马逊、谷歌云、Salesforce和Zoom开放早期访问权限
核心意图:Anthropic走的是“分化”而非“统一”的路线——Sonnet系列定位“速度和性价比”,Opus系列定位“极致智能”。同时,Claude 3.7率先引入“混合推理”模式,让同一个模型既能“快思考”也能“慢思考”。到Claude 4.5系列,Anthropic将编码能力和智能体执行能力作为核心突破口,Sonnet 4.5可自主编程30小时、Opus 4.5在代理任务上全面超越竞品。
2.3 核心差异:两种AI哲学的深层分野
ChatGPT与Claude的分野,不仅是技术路线的差异,更是两种产品哲学的对抗。以下从四个维度系统对比:
① 模型架构策略
- ChatGPT
:走向“统一模型”路线。从GPT-5开始整合推理与生成能力,到GPT-5.4将推理、编码、智能体工作流原生融合,让用户无需在多个模型间手动切换。
- Claude
:坚持“分化路线”,Sonnet定位速度与性价比,Opus定位极致智能。各系列有明确分工,同时通过API的“思考预算”参数让开发者自主调控。
② 产品定位
- ChatGPT
:从“聊天助手”进化为“Copilot”,强调作为用户的“副驾驶”,核心场景是辅助人类完成任务。大盘用户画像显示其C端泛用性和陪伴感更强。
- Claude
:从一开始就更偏向“Agent”——逐步强化“执行任务”的定位。从Claude 3.5的电脑操控能力,到Sonnet 4.5的30小时自主编程,Claude一直在追求“AI替人干活”的能力上限。
③ 记忆系统与设计哲学
- ChatGPT
:记忆系统设计上强调“连续性陪伴”——记住用户偏好和历史对话,让体验更个性化。
- Claude
:记忆系统更强调“任务导向”——在单次会话中深度理解上下文,完成复杂任务后“清空记忆”,体现了对隐私和专注度的不同考量。有分析指出,这反映了“AI是工具还是伙伴”的根本理念差异。
④ 商业化与生态
- ChatGPT
:背靠微软生态,通过API、ChatGPT Plus订阅和企业服务实现商业化,强调“普及性和实用性”。
- Claude
:通过亚马逊AWS和Google Cloud深度集成,在金融、医疗等合规要求严格的领域更具优势,企业级信任和安全是其核心卖点。
3.1 MCP(模型上下文协议):AI的“Type-C接口”
MCP是Model Context Protocol(模型上下文协议)的缩写。它由Anthropic公司于2024年11月推出并开源,旨在标准化大型语言模型与外部数据源、工具的交互方式。
为什么需要MCP?
在大模型时代早期,让AI调用外部工具是一个“方言满天飞”的混乱局面——每个模型都有自己的工具调用方式,开发者需要为不同的AI平台写不同的适配代码。MCP试图解决这个问题,它的定位就像AI工具调用的“Type-C协议”——让不同的模型可以通过统一标准进行交互。
MCP的核心能力:
- 共享上下文信息
:让AI应用能够将用户的环境、历史和数据上下文传递给模型
- 暴露工具和能力
:标准化地将数据库、API、文件系统等能力开放给AI系统
- 构建可组合的集成
:让不同的AI工具和服务可以像乐高积木一样组合使用
通俗理解,MCP就像是AI和外部世界之间的“翻译官”——无论底层是GPT、Claude还是其他模型,都能用同样的方式与数据库、文件系统、企业工具进行交互。这为AI从“孤立的聊天窗口”走向“连接万物的生态系统”奠定了协议基础。
3.2 Skill(技能):给AI的一本“工作手册”
Skill(技能)是AI领域另一个关键术语。这个概念最初来源于Claude,2025年10月16日被正式推出。Anthropic官方的解释是:“Skills能教会Claude如何以可重复的方式完成具体任务——比如按照贵公司的品牌规范生成文档、依托组织专属的工作流程分析数据,或是自动化处理各类个人事务。”
Skill与普通Prompt的区别:
如果把大模型比作一个“什么都懂但什么都不精的通才毕业生”,Skill就是你递给他的“工作手册”。这本手册里写明了在什么情况下、该按什么步骤、产出什么样的结果。
从技术原理上看,Skill与传统的编程函数有本质区别:
- 普通函数
:被代码调用,编译器知道何时执行
- Skill
:被LLM的推理过程“读懂”后,由模型自主决定要不要用
这意味着Skill不是硬编码的逻辑,而是一种“软约束”——它通过结构化的指令让模型的输出更加稳定,同时提高了能力的复用性。同一个Skill可以在不同业务场景中反复使用。
Skill vs Tool:
在AI Agent语境中,Tool(工具)是让AI“能够做什么”的能力(比如调用API、读写文件),而Skill是告诉AI“该怎么做好”的说明书。二者配合,才能让AI从“有手”进化到“会干活”。
以下按时间顺序呈现2025-2026年AI领域的关键节点:
但是自己可以给他写一下特定的Python 脚本。让他做特定的任务判断,这可行的。我自己就制作了一个桌面文档写入自动给我分类的脚本。 其他应用场景还需自己根据需要来做。
未来可能是 大模型用于重型计算工作,而私人模型会改变信息传播的载体。
开源王者ollama,正在突破底层的封装技术,压缩大模型体积越来越小。
而红帽正在搞企业级别大模型 一键部署,那些给企业做套壳业务的估计受到冲击。如果技术成熟,企业就会像安装一个软件那样,安装一个企业模型,运行在企业内部。
最后唠两句
为什么AI大模型成为越来越多程序员转行就业、升职加薪的首选
很简单,这些岗位缺人且高薪
智联招聘的最新数据给出了最直观的印证:2025年2月,AI领域求职人数同比增幅突破200% ,远超其他行业平均水平;整个人工智能行业的求职增速达到33.4%,位居各行业榜首,其中人工智能工程师岗位的求职热度更是飙升69.6%。
AI产业的快速扩张,也让人才供需矛盾愈发突出。麦肯锡报告明确预测,到2030年中国AI专业人才需求将达600万人,人才缺口可能高达400万人,这一缺口不仅存在于核心技术领域,更蔓延至产业应用的各个环节。
那0基础普通人如何学习大模型 ?
深耕科技一线十二载,亲历技术浪潮变迁。我见证那些率先拥抱AI的同行,如何建立起效率与薪资的代际优势。如今,我将积累的大模型面试真题、独家资料、技术报告与实战路线系统整理,分享于此,为你扫清学习困惑,共赴AI时代新程。
我整理出这套 AI 大模型突围资料包【允许白嫖】:
- ✅从入门到精通的全套视频教程
- ✅AI大模型学习路线图(0基础到项目实战仅需90天)
- ✅大模型书籍与技术文档PDF
- ✅各大厂大模型面试题目详解
- ✅640套AI大模型报告合集
- ✅大模型入门实战训练
这份完整版的大模型 AI 学习和面试资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

①从入门到精通的全套视频教程
包含提示词工程、RAG、Agent等技术点

② AI大模型学习路线图(0基础到项目实战仅需90天)
全过程AI大模型学习路线

③学习电子书籍和技术文档
市面上的大模型书籍确实太多了,这些是我精选出来的

④各大厂大模型面试题目详解

⑤640套AI大模型报告合集

⑥大模型入门实战训练

如果说你是以下人群中的其中一类,都可以来智泊AI学习人工智能,找到高薪工作,一次小小的“投资”换来的是终身受益!
应届毕业生:无工作经验但想要系统学习AI大模型技术,期待通过实战项目掌握核心技术。
零基础转型:非技术背景但关注AI应用场景,计划通过低代码工具实现“AI+行业”跨界。
业务赋能 突破瓶颈:传统开发者(Java/前端等)学习Transformer架构与LangChain框架,向AI全栈工程师转型。
👉获取方式:
有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/270425.html