2026年连不上Gemini CLI,试下DeepSeek-R1接入Claude code

连不上Gemini CLI,试下DeepSeek-R1接入Claude code这两天 Google 推出了 Gemini CLI 这个编程工具 功能和 Claude Code 基本一致 结果根本排不上队 登录一下很快闪退 和下图一样 使用感受令人不愉悦 很多人都在等着体验这个新工具 但现实是您可能要等很久才能轮到 不过 我发现了一个完美的替代方案 claude code router 它能让您用 DeepSeek R1 的强大推理能力来驱动 Claude Code Claude

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



这两天Google推出了Gemini-CLI这个编程工具,功能和Claude Code基本一致,结果根本排不上队,登录一下很快闪退,和下图一样,使用感受令人不愉悦。很多人都在等着体验这个新工具,但现实是您可能要等很久才能轮到。不过,我发现了一个完美的替代方案——claude-code-router,它能让您用DeepSeek-R1的强大推理能力来驱动Claude Code。

Claude Code Router [1] 本质上是一个"API路由器",国人自己的项目,它的核心思想很特别。这个项目可以把原本发送给Claude API的请求,重新路由到任何OpenAI兼容的API服务上,比如DeepSeek、OpenRouter、甚至本地的Ollama。听起来简单,但实际上这解决了一个大问题:您不再需要依赖昂贵的Claude API,也不用受限于单一模型的能力。

这个开源项目在GitHub上(地址在下文)已经获得了1.9k stars,说明它确实解决了很多开发者的痛点。项目作者不仅提供了完整的源码,还有详细的文档和配置示例,让部署变得非常简单。

图片

要理解claude-code-router的价值,我们得先明白Claude Code本身到底有多厉害。通过深入分析Claude Code的System Prompt和工具实现,可以发现这绝不是一个简单的聊天机器人,而是一个按照软件工程标准精心设计的AI智能体。

图片

Claude Code最核心的创新是它的上下文管理系统。传统AI对话很容易因为上下文窗口限制而"失忆",但Claude Code通过ClearTool实现了智能对话压缩。这个工具不是简单的截断,而是会深度分析整个对话历史,提取关键的技术细节、代码模式、架构决策,然后生成一个结构化的摘要。摘要包含7个关键部分:用户请求、技术概念、文件变更、问题解决过程、待办任务、当前工作状态和下一步计划。这意味着即使对话历史超过100轮,AI仍然能清楚地记住项目的来龙去脉。

更厉害的是MemoryTool带来的持久记忆能力。AI可以将重要信息保存到项目根目录的CLAUDE.md文件中,包括项目结构、代码约定、踩过的坑、解决方案等。下次打开项目时,AI会自动读取这些记忆,就像一个有经验的工程师重新熟悉代码库一样。这种设计让AI具备了"学习"和"积累"的能力,每次交互都在为下一次工作打基础。

从System Prompt可以看出,Claude Code被明确要求要具备工程师的思维模式。它必须"理解文件的代码约定"、"模仿代码风格"、"使用现有库和工具"、"遵循现有模式"。在实际工作中,它会先检查package.json确认项目依赖,参考邻近文件了解代码风格,然后再开始编码。完成代码后,还会主动运行lint和typecheck进行验证。这种工程化的工作流程,确保了代码质量和项目一致性。

Claude Code的交互设计完全针对命令行环境优化。System Prompt明确要求:"回答必须简洁直接"、"避免不必要的前言后语"、"一个词的回答最好"。这种极简风格看似简单,实际上需要AI具备很强的信息提炼能力。它必须在保持准确性的同时,将复杂的技术问题浓缩成最直接的答案,这正是命令行环境下开发者最需要的效率。

Claude Code还支持并行工具调用,可以同时执行多个操作,比如同时运行"git status"和"git diff",或者批量编辑多个文件。这种并行处理能力大大提升了工作效率,让AI能够跟上现代开发的快节奏。结合主动验证机制,整个系统体现了软件工程的**实践。

了解了Claude Code的强大之后,您可能会好奇:既然Claude Code这么厉害,为什么还要做一个Router项目呢?这就要从项目作者的经历说起了。作者在Github上有一篇Blog介绍了开发的初衷。

早在2025年2月25日,Claude Code发布的第二天,项目作者就开始了对这个工具的逆向工程。原因很简单:Anthropic屏蔽了中国区用户,想用Claude Code必须通过繁琐的申请流程,而且很可能申请不到。作为一个技术人员,作者选择了更直接的方式——既然无法正常使用,那就自己想办法。

通过深入的逆向分析,作者发现了一个关键信息:Claude Code允许通过环境变量来覆盖API地址。这个发现意义重大,因为它意味着可以在不修改Claude Code源码的情况下,将所有请求重定向到自定义的服务器。

基于这个发现,claude-code-router的核心技术原理就很清晰了:

  1. API格式转换:实现一个Express.js服务,提供端点,将OpenAI格式的API请求转换为Anthropic格式
  2. 环境变量劫持:通过设置将Claude Code的请求重定向到本地服务
  3. 中间件架构:使用中间件模式处理请求/响应的格式转换和内容重写

项目的发展也很有意思。最初因为DeepSeek不支持Function Call,作者选择了qwen-max模型。后来尝试过复杂的四模型分工机制(router、tool、think、coder),但发现免费小模型无法胜任任务分发的重任。

直到2025年5月底Claude Code正式发布,DeepSeek系列模型(包括5月28日发布的R1)开始完美支持Function Call,作者重新设计了整个架构。现在的四模型分工更加科学:默认模型兜底、background处理后台任务、think负责推理规划、longContext处理长文本场景。

这种演进过程体现了项目作者对技术的深度思考:不是为了技术而技术,而是为了解决实际问题而不断优化。最终的结果是,您可以以Claude十分之一的成本,获得接近Claude Code原生的使用体验。

部署claude-code-router的过程非常简单,您只需要三个步骤就能搞定,按照下面的方式即可。首先安装Claude Code官方工具,然后安装路由器,最后启动就行了。整个过程大概需要5分钟,比配置一个普通的开发环境还要快。我这里提供两种方案,以上是一个Mac的部署方案。如果在Windows里安装,需要切换到wsl -d ubuntu的环境,如果以下命令运行报错,再用Powershell的管理员终端进入,在以下命令之前加入sudo提权即可。

 
   
    
     
      
      
      
    

GPT plus 代充 只需 145
讯享网 
   
    
      
       
       
       
     
 
   
    
      
       
       
       
     

第一次运行时,系统会提示您输入API配置信息。您只需要依次填入:

  • OPENAI_BASE_URL
  • OPENAI_API_KEY: 您的DeepSeek API密钥
  • OPENAI_MODEL

配置完成后,所有信息会自动保存到文件中,下次启动就不用重新输入了。

说到模型选择,DeepSeek-R1真的是项目作者经过深度实践后的推荐选择。从claude-code-router的架构设计可以看出,作者专门将DeepSeek-R1配置为"think"模型,用于处理Claude Code的推理和Plan Mode任务。这个选择并非偶然:DeepSeek-R1具备强大的推理能力,在处理复杂编程任务时表现出色,特别适合需要深度思考的场景。从技术发展历程看,直到2025年5月28日DeepSeek-R1发布后,DeepSeek全系列模型才完美支持Function Call,这使得它能很好地驱动Claude Code的工具调用机制。更重要的是成本优势让人无法忽视:DeepSeek的价格不到Claude Sonnet 3.5的十分之一,在北京时间凌晨0:30到8:30之间,DeepSeek-R1的成本更是只有平时的25%。

图片

为了测试DeepSeek-R1的真实能力,刚才我让claude-code-router创建一个"炫酷的博客网站"。这个要求看似简单,但实际上需要AI具备项目规划、技术选型、代码实现和问题解决的全链路能力。结果让人印象深刻:DeepSeek-R1展现出了超乎预期的适应性和问题解决能力。

图片

一开始,DeepSeek-R1尝试使用标准的命令快速搭建项目。但它很快发现这个自动化工具会在终端中弹出交互式选择,无法在CLI环境中自动化完成。您猜怎么着,这时候DeepSeek-R1做出了一个决定:立即放弃自动化工具,改用手动创建的方式。它先创建项目目录,再逐个安装依赖,手动构建整个项目结构。

DeepSeek-R1不仅创建了基础的Next.js项目,还完整实现了现代Web开发的**实践。它自动选择了React 18、配置了Tailwind CSS进行样式管理、设置了PostCSS和Autoprefixer、创建了响应式的网格布局,甚至还加入了玻璃拟态效果和悬停动画。整个技术选型体现了对当前前端生态的深度理解,从页面结构到样式系统都考虑得很周全。

图片

经过一系列智能调整后,DeepSeek-R1成功交付了一个功能完整的博客网站。这个网站具备紫色到靛蓝的渐变背景、6个交互式博客卡片、响应式布局设计,在成功运行。从用户输入"创建一个炫酷的博客网站"到看到实际效果,整个过程展现了AI在复杂任务中的规划能力、执行能力和问题解决能力。

这个项目最厉害的地方在于它的路由策略。您可以配置不同的模型来处理不同类型的任务:可以用本地的qwen-coder处理后台任务,用DeepSeek-R1处理需要推理的复杂问题,用Gemini处理长上下文的任务。实际效果怎么样?用户反馈说,在VS Code Copilot用Claude-4处理Flutter问题时搞砸了文件,但用claude-code-router配合DeepSeek,几轮对话就完成了任务,成本还不到1块钱。

值得一提的是,项目作者在文档中还提到了一个很有意思的玩法:可以同时配置本地模型和云端API协同工作。比如用本地的Ollama跑qwen-coder处理一些简单的后台任务,同时用DeepSeek API处理复杂推理,这样既能保证效果又能进一步降低成本。不过说实话,我还没有深入尝试过这种混合部署方式,感觉应该会很有趣。

如果您对claude-code-router这个项目感兴趣,或者在使用过程中遇到什么问题,非常欢迎加入我们的技术交流群一起探讨。毕竟AI工具发展得这么快,大家一起分享经验、探索新玩法,肯定比一个人摸索要有效率得多。让我们一起在这个AI编程的新时代里,找到最适合自己的开发方式吧!

引用链接

 Claude Code Router: https://github.com/musistudio/claude-code-router


小讯
上一篇 2026-03-10 09:57
下一篇 2026-03-10 09:59

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/210851.html