📖 阅读时长:约8分钟
🎯 适合人群:技术爱好者、研究者、学生、开发者
💡 你将学到:GLM是什么、和其他大模型有什么不同、开源版怎么用
中国AI领域有一个现象:顶尖研究成果经常来自清华。
清华大学的计算机系和自动化系长期位居国内顶尖,而其中的知识工程研究室(KEG),在自然语言处理领域深耕了数十年。
智谱AI 就是从清华KEG实验室孵化出来的公司,而他们的大模型系列就叫 GLM(General Language Model,通用语言模型)。
学术根基: 清华大学 KEG 实验室
└── 孵化 ▼ 智谱AI(北京智谱华章) └── 研发 ▼
GLM系列大模型 → ChatGLM → GLM-4 → 智谱清言
GLM 不是直接复制GPT(从左到右生成),也不是BERT(纯双向理解),而是提出了一种新的架构:
Autoregressive Blank Infilling(自回归填空)
传统GPT: “今天天气真 __” → 预测下一个词“好”(单向)
传统BERT: “今天[MASK]真好” → 预测中间词(双向,不能生成)
GLM: 遮住任意长度的文字片段 用自回归方式(一个字一个字)填入被遮住的内容 兼具“理解”和“生成”两种能力
这种设计让GLM在理解型任务和生成型任务上都表现良好,而不像GPT系列更偏生成、BERT系列更偏理解。
2023年3月,智谱AI发布了 ChatGLM-6B,这是国内第一个开源的、可以在消费级GPU上运行的中文对话模型。
ChatGLM-6B 的意义: 参数量:60亿(6B) 显存需求:约13GB(GTX 1080 Ti 就能跑!) 中文能力:当时国内最强的开源中文对话模型 开源协议:可以学习研究,有限商用
这对整个中文开源AI社区来说是重大突破。在此之前,能跑中文对话模型要么需要昂贵的服务器,要么需要依赖OpenAI的API。
GLM-10B (2021) └── 学术研究版本,奠定GLM架构
ChatGLM-6B (2023.3) └── 第一个开源中文对话模型,社区爆炸
ChatGLM2-6B (2023.6) └── 能力大幅提升,支持32K上下文
ChatGLM3-6B (2023.10) ├── 更强的代码能力 └── 支持Function Calling(调用工具)
GLM-4 (2024) ├── 对标GPT-4水平 ├── 支持128K超长上下文 ├── 多模态:视觉理解(GLM-4V) └── All-tools:代码执行、联网、图片生成
GLM-4-9B (2024,开源版) └── 90亿参数开源版,可本地运行
GLM-Z1 (2025.4) └── 推理增强版,8倍推理速度,对标DeepSeek R1
GLM-4.7 (2025.12) └── 编码能力国际顶尖,开源+国产双第一
智谱AI 围绕 GLM 打造了完整的产品生态:
面向个人用户: 智谱清言(chatglm.cn)── 类似ChatGPT的对话产品
面向开发者: BigModel开放平台 ── GLM系列API,文档完善 CodeGeeX ── 专门的代码补全工具(类似GitHub Copilot)
开源社区: GitHub/HuggingFace ── ChatGLM系列开源权重 ModelScope ── 阿里旗下模型平台,也托管了GLM模型
CodeGeeX:程序员的专属利器
值得特别介绍的是 CodeGeeX,这是智谱AI推出的免费代码补全工具:
CodeGeeX 特点: • VS Code / JetBrains 等主流IDE插件 • 中文注释 → 代码的理解能力超强 • 支持20+编程语言 • 完全免费(连API都免费) • 代码补全速度快
如果你在用Python、Java、C++等写代码,CodeGeeX是比GitHub Copilot更适合中国开发者的选择(而且免费!)。
网页版
- 打开 chatglm.cn 或 bigmodel.cn
- 注册登录(手机号)
- 开始对话,基础功能免费
手机App
应用市场搜索“智谱清言”或“ChatGLM”。
本地部署(开发者)
# 使用 Ollama 运行 GLM ollama run glm4
# 或者通过 Hugging Face 下载: # 搜索 “THUDM/chatglm3-6b”
智谱GLM在国内学术圈影响力极大,原因有几个:
- 清华背景带来的信任感:在科研圈有天然的公信力
- 开源便于研究:学者可以研究模型内部,发表论文
- 中文能力强:很多中文NLP研究用GLM作为基础
- API免费/低价:学术用途友好
在国内高校,很多NLP相关的毕业论文和研究项目 选择基于ChatGLM进行实验,而不是GPT 原因:
- ChatGLM可以本地部署(数据不外传)
- API便宜(学生用得起)
- 有详细的中文技术文档
ChatGLM/GLM-4 LLaMA 3 通义千问 Qwen ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 中文能力 ⭐⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ 英文能力 ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ 代码能力 ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 开源程度 ✅ ✅ ✅ 最小可用版本 6B(~8GB显存) 8B(~8GB) 7B(~8GB) 国内社区 ⭐⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐ 学术引用 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐
智谱GLM/ChatGLM 是中国AI学术和工业界的重要产物:
- 🎓 清华出身:扎实的学术背景,技术有保障
- 🔓 坚持开源:国内最早、最持续的开源中文大模型系列
- 💻 开发者友好:API文档好、CodeGeeX免费、可本地部署
- 🔬 学术影响力:国内NLP研究的常用基础模型
- 🆓 低门槛:消费级显卡即可本地运行
如果你是学生、研究者、或者喜欢折腾开源AI的开发者,ChatGLM/智谱清言是必须了解的选项。
本专栏会持续更新,下一阶段将深入介绍更多模型:
- GitHub Copilot(代码AI工具)
- Runway Gen-3(另一个强大的视频AI)
- Adobe Firefly(设计师专用AI)
- 海螺AI(MiniMax)
- ……更多持续更新中
喜欢这个专栏的话,记得 关注 + 收藏!
有任何想了解的AI工具,评论区告诉我~
本文为【AI大模型百科专栏】第B09篇 · 爆发时代
作者:[孤岛站岗] | 更新时间:2026年4月
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/255236.html