OpenClaw 的免费 AI 大模型及其配置方法

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。
 OpenClaw 中的“自由模型”可能意味着两种不同的东西，而混淆这两种模型正是大多数人浪费时间的地方。
有一种“免费”是真正意义上的免费，因为模型运行在本地，你只需要支付 CPU、内存、GPU 和电力费用。例如 Ollama 或你自行托管的 OpenAI 兼容运行时环境。
另一种是“免费套餐”，即托管服务提供商提供一定的配额、积分或 OAuth 访问权限。这种套餐虽然不错，但通常会有速率限制、策略限制，而且偶尔还会出现意外中断或流量突然上限的情况。
本指南篇幅较长，因为模型配置看似简单，但一旦遇到问题，例如工具调用速度变慢、出现 429 错误，或者某个代理使用的身份验证配置文件与预期不符等，就会发现其中的奥妙。我们将力求实用。
如果您是 OpenClaw 新手，想先了解基础知识，可以阅读 OpenClaw 简介及其工作原理。如果您已经运行了 OpenClaw，接下来我们来正确地连接模型。
OpenClaw 模型引用使用provider/model格式。例如：或。
如果你设置了此项，实际上就创建了一个允许列表。只有列表中列出的模型才符合条件。这在你想防止不同环境下的模型选择出现随机偏差时非常有用。
在实际应用中非常重要的命令行助手： 
  
    
     
     用于初始身份验证和提供商设置 
     看看 OpenClaw 能看到什么 
     无需编辑配置即可快速切换 
    
这些内容在提供商文档中都有明确说明，可以避免配置错误。
策略A：本地优先，托管备用
这是我给大多数自托管用户的默认建议。本地模型可以处理繁琐的日常任务，而备用方案则可以应对“我需要更强大的处理器来处理这个问题”或“我的本地服务器繁忙”的情况。此外，由于大部分流量都停留在本地，因此成本也更可预测。
策略B：仅提供免费托管服务
如果你不需要进行任何本地推理，并且使用量很轻，那么这种方法可行。缺点是免费套餐的额度会变化，你会遇到限制，所以你需要一些备用方案。
策略C：仅限本地
从隐私和成本角度来看，这是最简洁的方案。但它也最依赖硬件。在小型机器上运行的 3B 模型在快速自动化方面表现出色，但在长时间的推理任务中则会崩溃。
奥拉玛
Ollama 是最常见的“我想要免费且本地化的服务”方案。OpenClaw 支持 Ollama 作为服务提供商，并且可以自动检测本地 Ollama 服务器。
最简配置如下所示：
然后设置您的默认模型：
如果你想要一套合理的“入门”模型，可以保留一个通用模型作为主模型，再添加一个编码模型作为备用。一开始规模要小，以后可以随时扩展。
Ollama 关于流媒体的警告
由于 SDK 和流格式的特殊性，某些 Ollama 配置的构建版本会禁用流式传输。如果您发现文本输出中泄露了奇怪的工具标记，通常就是这个原因。请将流式传输视为可选而非必需。
LM Studio vLLM LiteLLM llama.cpp 和其他 OpenAI 兼容运行时
OpenClaw 可以通过 . 使用几乎任何 OpenAI 兼容的基本 URL 。文档甚至展示了带有显式提供程序配置的 LM Studio 风格端点的模式。
示例模式：
请注意，这些字段的值都设置为零。这在配置中是一个很好的提示：本地模式意味着不按令牌计费。
本部分介绍一些可以让你无需立即付费即可运行 OpenClaw 的服务商。条款和配额可能会有所变动，有些“免费”服务实际上只是“促销额度用完前免费”。请将此视为一份清单，而非承诺。
Qwen OAuth
如果你想要一个不错的免费套餐，又不想费劲地“轮换12个API密钥”，我推荐你试试这个。OpenClaw通过OAuth设备代码流程和捆绑插件支持Qwen。
启用插件并登录：
模型参考格式如下： 
  
    
     
      
      
    
Qwen 的文档中描述了与 OAuth 访问相关的每日免费请求配额。
我个人的看法是： Qwen 是少数几个“免费版”仍然能满足实际工作需求的软件之一，前提是你得为合适的工作选择合适的模式。我不会用它来管理整个团队的免费业务，但对于个人经纪人来说，它可能是一个不错的选择。
OpenRouter 免费模型
OpenRouter 的优势在于它将多个模型聚合到一个提供商之下。他们的文档也解释了某些模型上的`:free`后缀。
在 OpenClaw 中，通常只需设置：
免费模型可能会随时间变化，因此请将模型选择视为需要定期重新评估的事情。如果某个免费模型消失，您需要提前配置好备用模型。
Groq
Groq之所以受欢迎，是因为它速度快，而且通常提供充足的流量供用户进行实验。您的具体流量配额取决于Groq在您所在地区和账户级别提供的配额。尽管如此，它仍然值得作为备用方案，因为一旦成功，流量几乎是瞬间到账的。
OpenClaw 内置了 Groq 作为提供程序，它使用。
Google Gemini
Gemini 也是一个内置的提供程序，它使用。
谷歌的免费使用量和速率限制取决于产品类型和套餐，因此我不会在类似这样的教程中给出具体的数值。如果您想大致了解情况，可以参考谷歌社区论坛上关于API类免费使用每日请求上限的讨论。
Mistral
Mistral 是另一个内置提供商。如果您所在地区有免费套餐，它可以作为不错的通用备选方案。OpenClaw 使用 Mistral进行身份验证。
Cohere
Cohere 常用于摘要和分类类工作。根据你的路由方式，你可以使用直接提供商或与 OpenAI 兼容的代理。如果你使用的是免费套餐，除非你确定它能满足你的使用需求，否则建议将其作为备用方案而非主要方案。
Moonshot Kimi 和 Kimi Coding
Kimi 通常并非“永久免费”，但通常可以通过促销活动、积分或合作伙伴计划获得。OpenClaw 的文档介绍了如何将 Moonshot 配置为具有 OpenAI 兼容基础 URL 的自定义提供商。
文档中的示例配置框架：
Kimi Coding 是文档中一个单独的提供程序路由。
DeepSeek
DeepSeek 通常被描述为“基本免费”，但这取决于您是在本地运行还是使用托管 API。如果您通过 Ollama 或本地 OpenAI 兼容服务器运行 DeepSeek，则成本仅为硬件费用。如果您使用托管 API，则通常成本较低，而非完全免费。
OpenClaw 通过两层机制处理故障。它可以在同一提供商内轮换身份验证配置文件，然后回退到下一个模型。
这比听起来更重要，因为免费套餐更容易达到速率限制，并且更容易出现“计费已禁用”状态。OpenClaw 会跟踪冷却时间，并在发生计费错误时延长用户配置文件的禁用时间。
身份验证配置文件的持久性以及为什么您的提供商会在周中“更改”
OpenClaw 将 API 密钥和 OAuth 令牌存储在身份验证配置文件中，并且为了缓存友好性，它会为每个会话固定一个选定的配置文件。
如果您为同一提供商设置了多个配置文件，OpenClaw 可以根据配置顺序或轮询规则轮换使用它们。
如果您感觉 OAuth 登录“消失”了，这通常只是因为登录名轮换。如果您希望登录行为可预测，请固定登录名顺序。
在你的政策架构中，以下几项应该是枯燥乏味的： 
  
    
     
     切勿提交 API 密钥。请将它们放在环境变量或 systemd 环境变量文件中。 
     未经授权，请勿将您的网关暴露在公共互联网上。请使用令牌、尾网或合适的反向代理。 
     保持工具访问权限合理。即使是免费模型，如果你的代理可以运行危险工具，它仍然有可能运行这些工具。 
    
如果你想了解“技能层”方面的内容，其安全理念是相同的。技能是执行层面，而非内容本身。这部分内容在我们的 OpenClaw 技能指南中有详细介绍。
OpenClaw 无法识别任何模型 
  
    
     
     运行并确认服务提供商出现。 
     如果使用 Ollama，请确保服务可访问并显示模型。 
     如果使用代理，请确认其是否与OpenAI API 兼容。 
    
我一直遇到401或403错误。 
  
    
     
     请检查该提供程序对应的正确环境变量。OpenClaw 的提供程序文档列出了所需的身份验证变量。 
     如果您有多个身份验证配置文件，则故障的配置文件可以轮换使用。请检查身份验证配置文件的顺序和冷却状态。 
    
我一直遇到 429 速率限制。 
  
    
     
     添加备用方案，以便 OpenClaw 在服务提供商限速时可以切换模型。 
     对于像长文档摘要这样的高负载工作流程，应降低并发量。 
     如果你使用的是免费套餐，请接受这是正常现象，并据此进行设计。
OpenClaw 的免费 AI 大模型及其配置方法

策略A：本地优先，托管备用

策略B：仅提供免费托管服务

策略C：仅限本地

奥拉玛

Ollama 关于流媒体的警告

LM Studio vLLM LiteLLM llama.cpp 和其他 OpenAI 兼容运行时

Qwen OAuth

OpenRouter 免费模型

Groq

Google Gemini

Mistral

Cohere

Moonshot Kimi 和 Kimi Coding

DeepSeek

身份验证配置文件的持久性以及为什么您的提供商会在周中“更改”

OpenClaw 无法识别任何模型

我一直遇到401或403错误。

我一直遇到 429 速率限制。

相关推荐