2026年如何优雅的让Claude Code使用第三方模型？

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

最近Claude Code爆火，很多人都说Cursor不香了。无奈原生的Claude Code使用对国人来说特别不便，我这里尝试了一些新的解决方案，希望对你流畅使用Claude Code有帮助。

Claude模型的母公司Anthropic，对国内用户使用限制特别多，我曾经注册或购买的几个号没多久就阵亡了。但人家的这个工具确实不错，我们没账号怎么办？

听说可以使用一些第三方模型了，比如最近国内月之暗面推出的Kimi-K2，它们机智的直接支持了Anthropic的API。我们可以简单配置一下，就可以在Claude Code中使用Kimi-K2模型了。但是有时我们想使用其他更强大的模型，比如Gemini，怎么办？

我又继续寻找到了最近刚开源的一个解决方案，，它支持了多个模型，包括Gemini，DeepSeek，GPT等。这里又产生一个问题，可以使用原生Gemini模型，但Google家模型不能精确控制预算，哪天你哐哐用，金钱也哗哗出的时候，看到账单傻眼了怎么办？

以上各个问题，本文都会尝试给一个解决方案，如果对你有帮助，请帮我点个赞吧！

本文假定你会Claude Code的安装和使用，我们直接进入主题：如何优雅的让Claude Code使用第三方模型？

这块已经有不少文章介绍了，我简单说几个关键点：

设置两个环境变量：

修改Claude Code的配置添加（你可能要先启动一次才会自动生成这个配置）：

然后重启Claude Code，就可以使用Kimi-K2模型了。在里面似乎kimi做得足够兼容，你连模型都不用切换，直接就开箱即用了。我问了一句你是谁，看来Claude Code有被骗到：）

kimi-k2

如果想更流畅使用，你可能至少需要充50元，不然那个限频等，体验应该会很差。

我感觉Kimi-K2这次挺“鸡贼”的，借了一波Claude Code的东风，应该引了不少新进，现在它官网开始提示繁忙起来了呢：）

我试着用了一阵Kimi-K2，有时候反应较慢，我在想是否可能把Gemini家的和OpenAI家的模型一起集成进来呢？方法当然是有的。

在一两周前，我在寻找如何让Claude Code可使用更多种第三方模型。在搜索这个问题的解法，国外的居然没有推荐这个项目，反倒是国内腾讯元宝给我介绍了有这样一个开源项目，（以下简称CCR）可能解决我的问题，一看到我甚为惊喜，我想莫不是这个项目是国人写的原因，咱离自己人更近。

A powerful tool to route Claude Code requests to different models and customize any request.

在GitHub仓库中也写了项目的。简单的说，作者经过逆向分析后，发现在Claude Code中它在调用模型时，各个参数都是通过环境变量获取的，作者想到开发一个中间件，将各个环境变量替换掉，这样可以实现调用第三方模型。同时因为Claude Code使用Anthropic API的规范，我们需要将对第三方模型的调用转换成Anthropic API的格式。

和类似通过npm即可安装。

你可以参考官方提供的示例，配置：

这里定义了不同的Provider，并且有一些模型可以有其设置。比如为了让DeepSeek模型更积极使用工具，有个tooluse的设置。比如为了转换Gemini模型，有个gemini的Transformer。同时可看到，它还真是国人开发，很有本地化特色，比如显式支持PROXY设置方便你访问某些模型。

到这里配置好后，当你在使用Claude Code时，想切换模型时，可以输入命令，然后选择你想要的模型。比如：在Claude Code Router中使用Kimi-K2

不过有点遗憾的是，当前通过CCR中还不支持Web搜索和图片上传，这离我们想要的完整体还是有点距离，但官方已经在计划中，并且这个项目最近更新很频繁，Star也涨得非常快。

折腾到这里就结束了吗？这里发生了一件小事，让我觉得有必要继续折腾一下。我使用OpenRouter来调用Claude模型，为了省钱，我已经很勤俭地只用 claude-3.7-sonnet 了，但几轮对话下来，发现账单还是有点夸张。我在一个不算太大的项目中进行了和简要对话而已。虽然OpenRouter提供了对每个KEY的费用限制（Credit limit），但是如Google的Gemini等模型，它就没有可以限制额度，那就只能等收到账单才后知后觉了？

问题不大，我想起来之前折腾过LiteLLM，它不仅能聚合LLM接口，还能像个贴心管家一样帮你控制预算。就决定是你了，继续折腾！

很早前想写一篇LiteLLM+Librechat的教程，但一直没时间，今天就让LiteLLM先出场吧。我继续在k8s中部署它，如果你是容器或其它方式，请参考官方文档，部署过程都是简单的。

我们创建一个configmap定义了LiteLLM的配置文件，大概内容如下：

接着定义一个Deployment即可。

要注意LiteLLM启动时，有时资源消耗会比较高，我的弱鸡k8s节点时不时会给搞得濒死，最好像上面限制一下资源。我们可以测试一下LiteLLM对外的接口是否正常，比如：

正常返回后，说明我们的LiteLLM服务工作正常。接下来我们就可以在claude-code-router中统一使用litellm作为唯一的Provider了。

现在，我们的config.json可以变得非常清爽，Providers里只留下litellm一个就行：

这里要注意，如果直接对接官方的Gemini模型，只需要配置的Transformer即可。但这里咱们是通过LiteLLM调用的，还需要配置的Transformer。不然会报类似下面这样的错误：

⎿ API Error: 400 } . Received Model Group=gemini/gemini-2.5-pro Available Model Group Fallbacks=None”,“type”:null,“param”:null,“code”:“400”}}”,“type”:“api_error”,“code”:“provider_response_error”}}

还好LiteLLM的日志相当给力，我通过排查请求体，很快就定位到问题出在 “cache_control” 这个字段上——删掉它就一切正常了。最后我们可以在LiteLLM的管理端看到每次Claude Code发出了哪些请求，使用了多少Token，花费了多少钱等。 LiteLLM管理端

我们也可以在LiteLLM中创建的API_KEY中定义它的额度，这样避免我们不小心超支。 LiteLLM API_KEY额度

现在，让我们开心的在Claude Code中使用各种模型吧！

本文介绍了三种方式让你更好的基于第三方大语言模型来使用Claude Code，希望对你有所帮助。我们除了直接使用Kimi-K2外，还可以使用CCR来扩展模型库，最后通过LiteLLM来统一LLM的调用，这样也能让我们更精细化的观察Token的使用以及控制费用。

三种方案对比：

以上便是最近关于Claude Code的一点折腾经验，希望对你有帮助。欢迎点赞、收藏、分享，更欢迎分享你的使用经验。我们下篇文章见。

我是个爱折腾技术的工程师，也乐于分享。欢迎点赞、关注、分享，更欢迎一起探讨技术问题，共同学习，共同进步。为了获得更及时的文章推送，欢迎关注我的公众号：爱折腾的风

扫码关注公众号

2026年如何优雅的让Claude Code使用第三方模型？

相关推荐