最近 GitHub Trending 上冲出一个项目,叫 GenericAgent,4.4K Star,核心代码只有 ~3K 行。我看完 README 的第一反应是:这玩意儿的哲学太有意思了——不预设技能,靠进化获得能力。
更离谱的是,整个仓库从 git init 到每一条 commit message,全是 GenericAgent 自己完成的。作者全程没打开过终端。
- GenericAgent 是什么
- 自我进化:跟其他 Agent 框架的根本区别
- 9 个原子工具 + ~100 行 Agent Loop
- 分层记忆系统
- 5 分钟上手
- 跟 Claude Code / OpenClaw 的对比
- 我的看法
GenericAgent 是一个极简的自主 Agent 框架。它的目标很直接:给任意 LLM 系统级控制能力——浏览器、终端、文件系统、键鼠输入、屏幕视觉、甚至手机(通过 ADB)。
但核心代码只有 ~3K 行。Agent Loop 也就 ~100 行。
它支持 Claude、Gemini、Kimi、MiniMax 等主流模型,跨平台运行。部署也简单:pip install + 填个 API Key 就能跑。
这是 GenericAgent 最核心的设计。
[New Task] --> [Autonomous Exploration] (install deps, write scripts, debug & verify) --> [Crystallize Execution Path into Skill] --> [Write to Memory Layer] --> [Direct Recall on Next Similar Task]
翻译成人话:
用几周之后,你的 Agent 会拥有一套完全属于你的技能树。这是从 3K 行种子代码里长出来的,别人的 Agent 没有这些东西。
这个机制让它跟 Claude Code 这种"每次会话都是白纸"的 Agent 有了本质区别。
GenericAgent 只提供 9 个原子工具,覆盖了跟外部世界交互的基础能力:
code_run 执行任意代码
file_read 读取文件
file_write 写入文件
file_patch 修改文件
web_scan 感知网页内容
web_execute_js 控制浏览器行为
ask_user 人机协作确认
update_working_checkpoint 持久化上下文
start_long_term_update 积累长期经验
看着少?但通过 code_run,Agent 可以在运行时动态安装 Python 包、写新脚本、调用外部 API、控制硬件——然后把临时能力固化为永久工具。
整个核心循环就是:感知环境 → 任务推理 → 调用工具 → 经验写入记忆 → 循环。~100 行代码搞定。
GenericAgent 的 Token 消耗极低——上下文窗口不到 30K,是其他 Agent(200K–1M)的零头。秘诀在于分层记忆:
- L0 — Meta Rules:Agent 的基础行为规则和系统约束
- L1 — Insight Index:极简索引层,快速路由与召回
- L2 — Global Facts:长期运行积累的稳定知识
- L3 — Task Skills / SOPs:可复用的任务流程
- L4 — Session Archive:已完成任务的归档记录,用于长程召回
分层设计的好处是:关键信息始终在上下文中,噪声更少,幻觉更低,成功率反而更高。
# 1. 克隆仓库 git clone https://github.com/lsdefine/GenericAgent.git cd GenericAgent # 2. 安装最小依赖 pip install streamlit pywebview # 3. 配置 API Key cp mykey_template.py mykey.py # 编辑 mykey.py,填入你的 LLM API Key # 4. 启动 python launch.pyw
除了默认的 Web UI,还支持多种前端:
python frontends/qtapp.py # Qt 桌面应用 streamlit run frontends/stapp2.py # 另一种 Streamlit UI python frontends/wechatapp.py # 微信 Bot(个人微信) python frontends/tgapp.py # Telegram Bot python frontends/app.py # Bot python frontends/fsapp.py # 飞书 Bot python frontends/wecomapp.py # 企业微信 Bot python frontends/dingtalkapp.py # 钉钉 Bot
前端选择相当丰富,基本覆盖了国内主流 IM 平台。
pip install + API Key 多服务编排 CLI + 订阅
浏览器控制 注入真实浏览器(保留登录态) 沙箱 / 无头浏览器 通过 MCP 插件
OS 控制 键鼠、视觉、ADB 多 Agent 委派 文件 + 终端
自我进化 自主生长 Skill 插件生态 会话间无状态
Token 消耗 <30K 上下文 大 大
关键差异在”自我进化”。Claude Code 每次会话都是白纸,而 GenericAgent 会把每次任务经验固化下来,下次直接复用。
GenericAgent 的哲学让我想到了一个类比:其他 Agent 框架像是一个工具齐全的瑞士军刀,而 GenericAgent 像是一颗种子——刚开始什么都没有,但用着用着就长成了一棵属于你的技能树。
3K 行代码能做的事情有限,但这种”最小核心 + 自我进化”的思路很有启发性。特别是对个人用户来说,一个越用越懂你的 Agent,比一个什么都会但每次都从头开始的 Agent 更实用。
感兴趣的可以去 GitHub 看看:github.com/lsdefine/GenericAgent
作者: itech001
来源: 公众号:AI人工智能时代
主页: https://www.theaiera.cn,每日分享最前沿的AI新闻和技术。
本文首发于 AI人工智能时代,转载请注明出处。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/272163.html