GLM-4.7 API 接入指南：开源编程 SOTA，Flash 版完全免费，国内怎么用（2026）

科技前沿 • 2026-04-21 07:50 • 阅读 3

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

GLM-4.7 是 Z.ai（智谱 AI）2025 年 12 月发布的编程专用模型。SWE-Bench Verified 73.8%，开源模型里排第一。Flash 版本完全免费，30B 参数跑出 59.2%，同规模里没有对手。

国内直连，开源可审计，下面说怎么接。

Flash 和 FlashX 是同一个模型，区别只在计费方式：Flash 免费但有速率限制，FlashX 付费但更稳定，适合生产环境。

GLM-4.7 的训练目标是 Agentic Coding，不是单纯的代码补全。

SWE-Bench Verified 73.8%：测的是模型能否独立修复 GitHub 真实 issue，73.8% 是 2025 年底开源模型的最高分
LiveCodeBench 84.9%：竞赛级代码题，覆盖算法、数据结构、系统设计
τ²-Bench 84.7：多步骤工具调用基准，测 Agent 场景下的工具使用稳定性

Flash 版本虽然参数少 10 倍，但 SWE-Bench 59.2% 在 30B 级别里是 SOTA。日常代码补全、单文件修改、写脚本，Flash 够用。

两个模型不是替代关系，是不同定位。

GLM-5 是 2026 年 2 月发布的通用旗舰，744B 参数，SWE-Bench 77.8%，比 GLM-4.7 高 4 个点，但价格更高，而且是通用模型，不是专门针对代码优化的。

选 GLM-4.7 的场景：

纯代码任务（生成、调试、重构）
成本敏感，高频调用
需要 Agent 工具调用稳定性
想先用免费版试试

选 GLM-5 的场景：

需要通用推理能力（不只是代码）
多模态任务
对绝对编程能力要求最高

详细的模型横评可以看 2026 大模型排行榜与选型指南，GLM 系列和 Claude、GPT、Qwen 的对比都在里面。GLM-5 的完整介绍在 GLM-5 API 接入指南。

官方 API 在智谱 AI 开放平台，需要注册、实名认证，流程繁琐。

通过 OfoxAI 更直接，国内直连，OpenAI 协议兼容，微信支付宝充值，三个版本都有：

base_url: https://api.ofox.ai/v1 model: z-ai/glm-4.7 # 旗舰版 model: z-ai/glm-4.7-flashx # 付费快速版 model: z-ai/glm-4.7-flash:free # 完全免费版

Python 调用：

from openai import OpenAI  client = OpenAI(base_url="https://api.ofox.ai/v1", api_key="你的Key") resp = client.chat.completions.create(  model="z-ai/glm-4.7-flash:free",  messages=[{"role": "user", "content": "帮我写一个二分查找函数"}] ) print(resp.choices[0].message.content)

换旗舰版只改 model 参数，其他代码不动。

Roo Code：Settings → API Provider 选 OpenAI Compatible，Base URL 填 https://api.ofox.ai/v1，API Key 填 OfoxAI 的 Key，Model ID 填 z-ai/glm-4.7。详细步骤参考 Roo Code API 配置指南。

Cline：配置方式和 Roo Code 一样，Provider 选 OpenAI Compatible，填同样的 base_url 和 model ID。

OpenClaw：API Provider 选 OpenAI Compatible，填 OfoxAI 接口地址和 Key，model 填 z-ai/glm-4.7。GLM-4.7 的 function calling 和 OpenClaw 的工具调用协议完全兼容。各工具的选型建议看 OpenClaw 模型推荐与排行。

Flash 免费版日常够用。代码补全、写测试、改 bug，速度和质量都不错，免费额度没有明显限制，个人项目完全够用。

中文注释是真的自然。GLM 系列中文训练数据量大，生成的注释、文档字符串、错误信息都是地道中文，不是机翻腔。国内团队的代码库用起来顺手很多。

工具调用稳定性不错。τ²-Bench 84.7 不是虚的，在 Roo Code 和 OpenClaw 里调工具，参数格式出错的情况很少。

多文件重构、大型代码库理解、需要长上下文的 Agent 任务，Flash 有时候会”忘记”前面的上下文，这时候切旗舰版更稳。

GLM-4.7 在开源编程模型里性价比最高。Flash 免费版是目前唯一免费且 SWE-Bench 超过 59% 的选项。

更完整的编程工具对比，看 AI 编程工具横评。

旗舰版性价比高，Flash 版完全免费，国内直连，OpenAI 协议兼容。先用 Flash 免费版试几个任务，成本为零。

通过 OfoxAI 一个 Key 同时管 GLM、Claude、Qwen，切换只改一个参数。

GLM-4.7 API 接入指南：开源编程 SOTA，Flash 版完全免费，国内怎么用（2026）

相关推荐