2026年【AI大模型入门】B09:智谱GLM/ChatGLM——清华系开源大模型,学术界和开发者必知

【AI大模型入门】B09:智谱GLM/ChatGLM——清华系开源大模型,学术界和开发者必知svg xmlns http www w3 org 2000 svg style display none svg

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 
  
    
     
      
     

📖 阅读时长:约8分钟
🎯 适合人群:技术爱好者、研究者、学生、开发者
💡 你将学到:GLM是什么、和其他大模型有什么不同、开源版怎么用





中国AI领域有一个现象:顶尖研究成果经常来自清华。

清华大学的计算机系自动化系长期位居国内顶尖,而其中的知识工程研究室(KEG),在自然语言处理领域深耕了数十年。

智谱AI 就是从清华KEG实验室孵化出来的公司,而他们的大模型系列就叫 GLM(General Language Model,通用语言模型)

学术根基: 清华大学 KEG 实验室

 └── 孵化 ▼ 智谱AI(北京智谱华章) └── 研发 ▼ 

GLM系列大模型 → ChatGLM → GLM-4 → 智谱清言


GLM 不是直接复制GPT(从左到右生成),也不是BERT(纯双向理解),而是提出了一种新的架构:

Autoregressive Blank Infilling(自回归填空)

传统GPT: “今天天气真 __” → 预测下一个词“好”(单向)

传统BERT: “今天[MASK]真好” → 预测中间词(双向,不能生成)

GLM: 遮住任意长度的文字片段 用自回归方式(一个字一个字)填入被遮住的内容 兼具“理解”和“生成”两种能力

这种设计让GLM在理解型任务生成型任务上都表现良好,而不像GPT系列更偏生成、BERT系列更偏理解。


2023年3月,智谱AI发布了 ChatGLM-6B,这是国内第一个开源的、可以在消费级GPU上运行的中文对话模型

ChatGLM-6B 的意义: 参数量:60亿(6B) 显存需求:约13GB(GTX 1080 Ti 就能跑!) 中文能力:当时国内最强的开源中文对话模型 开源协议:可以学习研究,有限商用 

这对整个中文开源AI社区来说是重大突破。在此之前,能跑中文对话模型要么需要昂贵的服务器,要么需要依赖OpenAI的API。


GLM-10B (2021) └── 学术研究版本,奠定GLM架构

ChatGLM-6B (2023.3) └── 第一个开源中文对话模型,社区爆炸

ChatGLM2-6B (2023.6) └── 能力大幅提升,支持32K上下文

ChatGLM3-6B (2023.10) ├── 更强的代码能力 └── 支持Function Calling(调用工具)

GLM-4 (2024) ├── 对标GPT-4水平 ├── 支持128K超长上下文 ├── 多模态:视觉理解(GLM-4V) └── All-tools:代码执行、联网、图片生成

GLM-4-9B (2024,开源版) └── 90亿参数开源版,可本地运行

GLM-Z1 (2025.4) └── 推理增强版,8倍推理速度,对标DeepSeek R1

GLM-4.7 (2025.12) └── 编码能力国际顶尖,开源+国产双第一


智谱AI 围绕 GLM 打造了完整的产品生态:

面向个人用户: 智谱清言(chatglm.cn)── 类似ChatGPT的对话产品

面向开发者: BigModel开放平台 ── GLM系列API,文档完善 CodeGeeX ── 专门的代码补全工具(类似GitHub Copilot)

开源社区: GitHub/HuggingFace ── ChatGLM系列开源权重 ModelScope ── 阿里旗下模型平台,也托管了GLM模型

CodeGeeX:程序员的专属利器

值得特别介绍的是 CodeGeeX,这是智谱AI推出的免费代码补全工具

CodeGeeX 特点: • VS Code / JetBrains 等主流IDE插件 • 中文注释 → 代码的理解能力超强 • 支持20+编程语言 • 完全免费(连API都免费) • 代码补全速度快 

如果你在用Python、Java、C++等写代码,CodeGeeX是比GitHub Copilot更适合中国开发者的选择(而且免费!)。


网页版

  1. 打开 chatglm.cn 或 bigmodel.cn
  2. 注册登录(手机号)
  3. 开始对话,基础功能免费

手机App

应用市场搜索“智谱清言”或“ChatGLM”。

本地部署(开发者)

# 使用 Ollama 运行 GLM ollama run glm4

# 或者通过 Hugging Face 下载: # 搜索 “THUDM/chatglm3-6b”


智谱GLM在国内学术圈影响力极大,原因有几个:

  1. 清华背景带来的信任感:在科研圈有天然的公信力
  2. 开源便于研究:学者可以研究模型内部,发表论文
  3. 中文能力强:很多中文NLP研究用GLM作为基础
  4. API免费/低价:学术用途友好
在国内高校,很多NLP相关的毕业论文和研究项目 选择基于ChatGLM进行实验,而不是GPT 原因:

  1. ChatGLM可以本地部署(数据不外传)
  2. API便宜(学生用得起)
  3. 有详细的中文技术文档

 ChatGLM/GLM-4 LLaMA 3 通义千问 Qwen ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 中文能力 ⭐⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐⭐ 英文能力 ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ 代码能力 ⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ 开源程度 ✅ ✅ ✅ 最小可用版本 6B(~8GB显存) 8B(~8GB) 7B(~8GB) 国内社区 ⭐⭐⭐⭐⭐ ⭐⭐⭐ ⭐⭐⭐⭐ 学术引用 ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐ ⭐⭐⭐ 

智谱GLM/ChatGLM 是中国AI学术和工业界的重要产物:

  • 🎓 清华出身:扎实的学术背景,技术有保障
  • 🔓 坚持开源:国内最早、最持续的开源中文大模型系列
  • 💻 开发者友好:API文档好、CodeGeeX免费、可本地部署
  • 🔬 学术影响力:国内NLP研究的常用基础模型
  • 🆓 低门槛:消费级显卡即可本地运行

如果你是学生、研究者、或者喜欢折腾开源AI的开发者,ChatGLM/智谱清言是必须了解的选项。


本专栏会持续更新,下一阶段将深入介绍更多模型:

  • GitHub Copilot(代码AI工具)
  • Runway Gen-3(另一个强大的视频AI)
  • Adobe Firefly(设计师专用AI)
  • 海螺AI(MiniMax)
  • ……更多持续更新中

喜欢这个专栏的话,记得 关注 + 收藏
有任何想了解的AI工具,评论区告诉我~


本文为【AI大模型百科专栏】第B09篇 · 爆发时代
作者:[孤岛站岗] | 更新时间:2026年4月

小讯
上一篇 2026-04-10 19:20
下一篇 2026-04-10 19:18

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/255236.html