GLM-4.7 API 接入指南:开源编程 SOTA,Flash 版完全免费,国内怎么用(2026)

GLM-4.7 API 接入指南:开源编程 SOTA,Flash 版完全免费,国内怎么用(2026)GLM 4 7 是 Z ai 智谱 AI 2025 年 12 月发布的编程专用模型 SWE Bench Verified 73 8 开源模型里排第一 Flash 版本完全免费 30B 参数跑出 59 2 同规模里没有对手 国内直连 开源可审计 下面说怎么接 Flash 和 FlashX 是同一个模型 区别只在计费方式 Flash 免费但有速率限制 FlashX 付费但更稳定

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



GLM-4.7 是 Z.ai(智谱 AI)2025 年 12 月发布的编程专用模型。SWE-Bench Verified 73.8%,开源模型里排第一。Flash 版本完全免费,30B 参数跑出 59.2%,同规模里没有对手。

国内直连,开源可审计,下面说怎么接。

Flash 和 FlashX 是同一个模型,区别只在计费方式:Flash 免费但有速率限制,FlashX 付费但更稳定,适合生产环境。

GLM-4.7 的训练目标是 Agentic Coding,不是单纯的代码补全。

  • SWE-Bench Verified 73.8%:测的是模型能否独立修复 GitHub 真实 issue,73.8% 是 2025 年底开源模型的最高分
  • LiveCodeBench 84.9%:竞赛级代码题,覆盖算法、数据结构、系统设计
  • τ²-Bench 84.7:多步骤工具调用基准,测 Agent 场景下的工具使用稳定性

Flash 版本虽然参数少 10 倍,但 SWE-Bench 59.2% 在 30B 级别里是 SOTA。日常代码补全、单文件修改、写脚本,Flash 够用。

两个模型不是替代关系,是不同定位。

GLM-5 是 2026 年 2 月发布的通用旗舰,744B 参数,SWE-Bench 77.8%,比 GLM-4.7 高 4 个点,但价格更高,而且是通用模型,不是专门针对代码优化的。

选 GLM-4.7 的场景:

  • 纯代码任务(生成、调试、重构)
  • 成本敏感,高频调用
  • 需要 Agent 工具调用稳定性
  • 想先用免费版试试

选 GLM-5 的场景:

  • 需要通用推理能力(不只是代码)
  • 多模态任务
  • 对绝对编程能力要求最高

详细的模型横评可以看 2026 大模型排行榜与选型指南,GLM 系列和 Claude、GPT、Qwen 的对比都在里面。GLM-5 的完整介绍在 GLM-5 API 接入指南。

官方 API 在智谱 AI 开放平台,需要注册、实名认证,流程繁琐。

通过 OfoxAI 更直接,国内直连,OpenAI 协议兼容,微信支付宝充值,三个版本都有:

base_url: https://api.ofox.ai/v1 model: z-ai/glm-4.7 # 旗舰版 model: z-ai/glm-4.7-flashx # 付费快速版 model: z-ai/glm-4.7-flash:free # 完全免费版

Python 调用:

from openai import OpenAI  client = OpenAI(base_url="https://api.ofox.ai/v1", api_key="你的Key") resp = client.chat.completions.create(  model="z-ai/glm-4.7-flash:free",  messages=[{"role": "user", "content": "帮我写一个二分查找函数"}] ) print(resp.choices[0].message.content)

换旗舰版只改 model 参数,其他代码不动。

Roo Code:Settings → API Provider 选 OpenAI Compatible,Base URL 填 https://api.ofox.ai/v1,API Key 填 OfoxAI 的 Key,Model ID 填 z-ai/glm-4.7。详细步骤参考 Roo Code API 配置指南。

Cline:配置方式和 Roo Code 一样,Provider 选 OpenAI Compatible,填同样的 base_url 和 model ID。

OpenClaw:API Provider 选 OpenAI Compatible,填 OfoxAI 接口地址和 Key,model 填 z-ai/glm-4.7。GLM-4.7 的 function calling 和 OpenClaw 的工具调用协议完全兼容。各工具的选型建议看 OpenClaw 模型推荐与排行。

Flash 免费版日常够用。代码补全、写测试、改 bug,速度和质量都不错,免费额度没有明显限制,个人项目完全够用。

中文注释是真的自然。GLM 系列中文训练数据量大,生成的注释、文档字符串、错误信息都是地道中文,不是机翻腔。国内团队的代码库用起来顺手很多。

工具调用稳定性不错。τ²-Bench 84.7 不是虚的,在 Roo Code 和 OpenClaw 里调工具,参数格式出错的情况很少。

多文件重构、大型代码库理解、需要长上下文的 Agent 任务,Flash 有时候会”忘记”前面的上下文,这时候切旗舰版更稳。

GLM-4.7 在开源编程模型里性价比最高。Flash 免费版是目前唯一免费且 SWE-Bench 超过 59% 的选项。

更完整的编程工具对比,看 AI 编程工具横评。

旗舰版性价比高,Flash 版完全免费,国内直连,OpenAI 协议兼容。先用 Flash 免费版试几个任务,成本为零。

通过 OfoxAI 一个 Key 同时管 GLM、Claude、Qwen,切换只改一个参数。

小讯
上一篇 2026-04-21 07:51
下一篇 2026-04-21 07:49

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/272469.html