是专为AI智能体开发的无头(无界面)浏览器命令行工具,无需可视化界面即可实现网页访问、动态内容渲染、页面元素交互、数据抓取等操作,完美适配智能体自动化处理网页相关任务的需求,无需人工介入。
- 无头模式访问任意网页,支持JS动态渲染(兼容单页应用SPA)
- 抓取网页完整HTML、文本、指定元素内容
- 模拟浏览器基本操作(点击、输入、翻页)
- 支持设置请求头、代理、Cookie,适配个性化访问需求
- 输出结构化数据(JSON),便于智能体解析处理
- 支持网页截图、PDF导出,留存网页内容
✅ 无头运行:无可视化界面,适配服务器/智能体后台运行
✅ JS渲染:支持Vue/React等单页应用,抓取动态内容
✅ 结构化输出:JSON格式数据,智能体可直接解析处理
✅ 轻量高效:命令行调用,无冗余依赖,响应速度快
✅ 高度可配置:支持代理、Cookie、请求头自定义,适配复杂场景
- AI智能体自动抓取网页资讯、行业数据并总结
- 自动化监控网页指定内容更新(如商品价格、公告)
- 模拟人工完成网页简单操作(搜索、表单提交)
- 批量抓取网页指定元素,整理结构化数据
- 智能体访问网页后,提取核心信息生成报告
- 工具地址:
- 适用平台:macOS / Linux(兼容主流类Unix系统)
- 核心适配:AI智能体、自动化脚本、命令行网页操作
- 安装命令:
推荐使用 npm 安装
从源码编译安装
- 导航:(打开指定页面)
- 快照:(获取带引用标识的元素,如 @e1、@e2)
- 使用快照返回的引用标识进行元素交互
- 页面导航或 DOM 结构大幅变化后,重新生成快照
页面导航
页面快照(页面分析)
元素交互(使用快照返回的 @ 引用标识)
获取页面/元素信息
检查元素状态
截图与 PDF 导出
视频录制
录制会创建新的上下文,但保留会话中的 Cookie 和存储数据。若未指定 URL,录制时会自动回到当前页面。建议先探索页面,再启动录制以获得流畅的演示效果。
等待操作
鼠标控制
语义化定位器(替代引用标识的方式)
浏览器设置
Cookie 与本地存储
网络控制
标签页与窗口管理
框架(Frame)操作
对话框处理
执行 JavaScript 代码
会话状态管理
添加 参数可输出机器可读的 JSON 格式数据:
- Linux ARM64 架构下若提示命令未找到,使用 bin 目录下的完整路径执行
- 元素查找失败时,重新执行 snapshot 命令获取最新的元素引用标识
- 页面加载异常时,在导航命令后添加 wait 命令等待页面加载
- 使用 --headed 参数打开可见浏览器窗口,直观调试操作流程
- --session <名称> :使用独立的隔离会话 名称>
- --json:输出 JSON 格式数据
- --full:截取整页截图
- --headed:显示浏览器窗口(有头模式)
- --timeout:设置命令超时时间(单位:毫秒)
- --cdp <端口> :通过 Chrome DevTools Protocol 端口连接浏览器 端口>
- 元素引用标识(@e1 等)仅在当前页面加载后稳定,页面导航后会失效
- 页面导航后务必重新执行 snapshot 获取新的元素引用标识
- 填充输入框时优先使用 fill 命令(自动清空原有内容),而非 type 命令
- 技能文档相关问题:在 提交 Issue
- CLI 工具本身问题:在 提交 Issue
本文档适用于为 Agent Browser 技能贡献代码/文档,该技能是 agent-browser CLI 工具的封装层,请先定位问题归属再反馈。
在此仓库提交 Issue 的场景
- 技能文档描述不清或内容缺失
- SKILL.md 中的示例代码无法运行
- 使用该技能封装层调用 CLI 工具时需要技术支持
- 技能缺失某个 CLI 工具已支持的命令/功能
在 agent-browser 仓库提交 Issue 的场景
- CLI 工具崩溃或抛出错误
- 命令行为与文档描述不符
- 浏览器自动化功能存在 Bug
- 需要给 CLI 工具新增功能
- 安装最新版本工具
- 在终端直接测试命令,定位问题是否属于技能封装层
使用以下模板提供完整信息:
当上游 CLI 工具新增命令时,需同步更新 SKILL.md:
- 保留“安装”章节内容
- 将新命令添加到对应分类下
- 补充使用示例
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/232349.html