如果你准备让 OpenClaw 直接联网查资料,那么最值得先搞清楚的就是 和 这两个工具。前者负责搜索,后者负责抓取网页正文。这篇文章把官方文档整理成中文,并把关键配置和示例代码一起搬过来,方便直接照着配。
- 想让 OpenClaw 具备联网搜索能力,但不确定该接 Brave、Perplexity 还是 Gemini
- 想知道 和浏览器工具有什么区别,避免工具选错
- 想把官方文档里的配置块和调用示例直接整理成可复用笔记
OpenClaw 官方把 Web Tools 拆成了两个轻量工具:
- :负责联网搜索,支持 Brave Search API、Gemini、Grok、Kimi 和 Perplexity Search API
- :负责用 HTTP 抓网页,并把 HTML 提取成更适合模型阅读的 markdown 或纯文本
这里有一个边界要记住:
- 它们不是浏览器自动化工具
- 如果目标站点强依赖 JavaScript、需要登录,或者要点按钮、滚动页面,应该改用 Browser 工具
官方文档里的核心逻辑可以压缩成 4 点:
- 会调用你配置好的搜索提供方,然后返回搜索结果
- 搜索结果会按 query 缓存,默认缓存 15 分钟
- 只做普通 HTTP GET,不执行页面里的 JavaScript
- 默认就是开启的,除非你显式关闭
官方文档把不同提供方的能力差异讲得比较清楚,整理如下:
如果你没有在配置里明确设置 provider,OpenClaw 会按下面的顺序自动检测:
- Brave
- Gemini
- Grok
- Kimi
- Perplexity
对应的检查条件是环境变量或者配置项里有没有可用 key:
- Brave: 或
- Gemini: 或
- Grok: 或
- Kimi:、 或
- Perplexity:、 或
如果一个都没找到,系统会回退到 Brave,然后再给出缺失 key 的错误提示。
官方还特别提到 的行为:
- 会在 Gateway 启动或 reload 时一次性解析
- 自动检测模式下,只会解析最终选中的那个 provider 所需的 key
- 如果选中的 provider 配的是 ,但又解析失败,且没有环境变量兜底,Gateway 会直接在启动或 reload 时失败
官方推荐直接运行:
如果你更习惯自己写配置,也可以直接改配置文件或者设置环境变量。
官方给出的步骤是:
- 去 创建 Brave Search API 账户
- 选择 Search plan 并生成 API key
- 运行 ,或者直接设置
文档里还特别说明了计费点:
- 每个 Brave plan 都带有每月 5 美元免费额度
- Search 的价格是每 1000 次请求 5 美元
- 也就是说,这个免费额度大致覆盖每月 1000 次查询
- 官方建议你在 Brave 控制台里顺手设置 usage limit,避免超额
如果你想显式指定 Brave 作为 provider,配置可以这样写:
如果你想启用 Brave 的 模式,可以这样配:
- 和 / 还能用
- 、、、 会被拒绝
官方给出的步骤是:
- 去 创建账号并生成 API key
- 运行 ,或者设置
原生 Perplexity Search API 的配置例子:
如果你走的是旧的 Sonar / OpenRouter 兼容路径,官方示例是:
这里有两个关键兼容性提醒:
- 如果使用 ,或者 这类 key,系统会走 Sonar 兼容路径
- 如果你显式设置了 或 ,也会切回 chat-completions 兼容路径
在这种兼容模式下,Search API 专属的过滤能力不是都能用。官方明确写了:
- 兼容模式只支持 和
- 其他只属于原生 Search API 的参数会返回明确错误
Gemini 这一条的特点是:它不是传统“列结果页”,而是直接给模型综合答案,并附带基于 Google Search 的引用来源。
官方建议的流程是:
- 去
- 创建 API key
- 在 Gateway 环境里设置 ,或者在配置里写
环境变量也可以放到本地:
Gemini 的配置块如下:
官方文档里还有几个实现层面的说明,值得记一下:
- 引用里的 Google 跳转链接会被解析成真实直链
- 这个解析过程会经过 SSRF 防护路径,包含 HEAD 和 redirect 检查以及 校验
- 默认 SSRF 策略会拦截私网和内网目标
- 默认模型是
要让 可用,至少要满足两件事:
- 不能是
- 对应 provider 的 API key 必须能拿到
官方给出的通用配置示例如下:
官方文档里的参数可以整理成这样:
文档里的适用范围说明也别忽略:
- 除非特别标注,这些参数主要适用于 Brave 和原生 Perplexity Search API
- OpenRouter / Sonar 兼容模式只支持 和
- 如果你在兼容模式下传了 Search API 专属参数,系统会直接报错,而不是默默忽略
下面这些就是官方文档里给出的典型示例,我按原意保留成可直接参考的版本。
按德国区域与语言搜索:
只看最近一周:
按日期区间搜索:
按域名过滤结果,适用于 Perplexity:
排除不想看的域名,适用于 Perplexity:
的职责更简单:拿到一个 URL,然后尽量把网页正文抽出来,交给模型阅读。
- 默认先用 Readability 提取正文
- 如果 Readability 失败,再走 Firecrawl 作为 fallback
- 如果两条路都失败,就返回错误
的基本要求有两条:
- 不能是
- 如果你要使用 Firecrawl fallback,需要 或
官方给出的配置块如下:
官方给出的工具参数并不多:
这一段在实际使用里很重要,建议直接记住:
- Firecrawl 的请求默认启用 bot-circumvention 和缓存
- Firecrawl 的 只会在 Firecrawl 真正启用时解析
- 如果 Firecrawl 处于启用状态,但 无法解析,且也没有 兜底,Gateway 会在启动或 reload 时失败
- 默认会发送接近 Chrome 的 和
- 会拦截私网与内网主机名,并在跳转时继续复检,跳转次数受 限制
- 最终会被 截断
- 响应体大小受 控制,超出时会带 warning 截断
- 一些站点如果正文提取效果不好,或者必须执行 JS,还是要换 Browser 工具
官方文档最后还提醒了一个很容易漏掉的配置:
- 如果启用了 tool allowlist,需要显式加入 和
- 或者直接加
另外,如果 缺少 API key,它会返回带有文档链接的 setup hint,而不是只抛一个很干的错误。
如果你要的是“查资料并拿到搜索结果”,用 ;如果你已经有具体 URL,想把正文抓出来给模型读,用 。前者重点在 provider 选择和 API key,后者重点在正文提取、Firecrawl fallback 和 SSRF 安全边界。
- 官方文档:https://docs.openclaw.ai/tools/web
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/236415.html