GLM-5V-Turbo + GLM-5.1，智谱这俩新模型把深度开发玩明白了

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

最近在用 Claude Code 写点网站类的项目，之前文章里也给大家分享过，用具备视觉能力的来写前端，基本是“给图就能出”，页面布局几乎不需要自己动手了。（参见：）

但经常写网站的小伙伴都知道，光有前端并不是一个完整的网站，还需要有后端。前端负责交互界面，后端负责业务逻辑和数据管理。

有人会觉得，后端不就是写接口、连数据库吗？没有复杂 UI，AI 处理起来应该更简单吧。

其实不然，后端由于跟业务相关度更高，因此代码逻辑往往更复杂。而且实际的项目中经常遇到需求变更或者增加功能的情况，这个时候不仅要新增代码，还需要兼顾原有代码。我们经常听到的“屎山”代码，多数就是在这种反复变更中产生的。

之前我用过的一些模型，也都能写后端。比如让它给你写个图书管理系统、博客网站、打卡工具等等，分分钟钟给你搭一个出来，有些效果还挺惊艳。

但真在项目中用起来，规模变大，且需要结合已有代码做改动时，各种状况就出现了：

这就是依赖上下文的 AI 大模型面对（Long Horizon Tasks）时的挑战：根据目标规划路径和步骤、在多次对话之后仍保持任务目标、多工具协同等等。

不过这两天在网上看见一则来自国外开发者的反馈让我眼前一亮：

这么强吗？

于是我就去了解了一下，发现智谱的这个新模型还真不简单：

首先是编程能力的提升，在多个主流基准测试中得分直逼 Claude Opus 4.6，位列国产模型第一、开源模型第一。

其次是对长程任务的良好支持。比如这个带有完整的桌面、窗口管理器、状态栏、应用程序等的 Linux 桌面系统，完全由模型自己根据架构草图规划、开发、测试，出错后自行修复，历时8小时、1200多步，最终交付工程级成果。

那现在我就用它来开发上次那个复刻网站的后端部分，完成整个项目，看看是不是真的好使。

接入 Claude Code 很简单，改一下用户目录/.claude/settings.json：

{  "env": {    "ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-5.1",    "ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-5.1",    "ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5.1",    "hasCompletedOnboarding": true,    "ANTHROPIC_AUTH_TOKEN": " 
       <替换成你的api-key>
         " 
       ,    "ANTHROPIC_BASE_URL": "https://open.bigmodel.cn/api/anthropic",    "API_TIMEOUT_MS": "",    "CLAUDE_CODE_DISABLE_NONESSENTIAL_TRAFFIC": 1  }}

然后进终端，claude 启动。

如果你像我一样之前就接入过智谱的 API，那直接在 claude 里面运行 /model glm-5.1 切一下模型就好了。

然后我们就可以开始了。

但这次我没有让 AI 直接开干，而是给出目标和要求后，要它先给我拆解任务并生成开发文档。

这样有几点好处：

1. 在动手前确认 AI 对目标的理解是否正确，减少返工

2. 拆分成子任务后更能保证每个环节的质量，从而提升整体质量

3. 保证开发过程中的一致性，包括接口、数据结构、命名规范等，即使会话中断了，下次也能接上

4. 如果后续有功能增加或改动，结合文档来做修改会更稳定

这其实也是真实软件工程的常规操作。

分析了十来分钟，AI 给了我3份详尽的文档，并且列出了开发步骤。

确认没啥问题，就让它放手去干吧！

AI 会按照既定的步骤逐步执行，中间除了一些执行权限和结果验收需要我手动确认外，不需要其他额外人为干涉。就这么自己吭哧吭哧地写了20多分钟后，告诉我搞定了。

说实话我这时还有点担心，因为根据以往经验，AI 思考这么久的任务，经常最后跑偏了。

按 AI 的提示运行前后端，打开网页验收。因为我们之前就完成了前端，所以乍一看好像没什么变化。不过从 django 后台管理页面可以看到，商品、类别这些信息都有了对应的后台数据。

网站支持注册/登录了。

商品可点进去查看详情，添加购物车结算。

一轮对话就基本完成了后端框架的主体，这是在我的预期之上的。过去这种从零搭建整个电商后端的任务，即使对框架比较熟悉，那也得一两天的工作量。更别说根据给定前端来实现后端了，光理清页面接口就让人头大。

当然，GLM-5.1 给出的代码也免不了会有各种 bug 和未完善的地方。比如现在首页上的商品图片显示不出来了。

在最核心的购物流程上也报错了。

照例还是让 AI 自己去 debug。GLM-5.1 虽然不是视觉模型，但它可以调用图像理解的 MCP 工具来协作，所以我们也一样可以把报错情况截图后，附加在对话中让它理解。

这里的错误很快在一两轮对话后就被修正了。页面显示正常，购物流程也顺利跑通。

仅仅如此的话，这似乎也没有比开发个工具 demo 复杂太多。不如再来给 GLM-5.1 上上强度，像个产品经理一样给它整点“你早不说”的需求变更。

原版网站是有个地区和货币切换功能的。这个我们在前面的需求中没有指明，现在再让 AI 给加上。再得寸进尺一点：不但要切换货币，连整个网站的语言也要跟着变。

这种功能叫做（国际化），也算是 Web 开发中较常见的需求，但如果一开始设计中没有考虑，之后再变更，那会让开发者很烦躁，因为它的改动会涉及到几乎所有的页面。不知道 GLM-5.1 对于这种在已有代码的基础上做大面积修改的场景还能否保持一致性和稳定性。

花了将近半个小时的理解、分析、修改，任务完成。

一个好消息，功能实现了。

一个坏消息，有些地方没翻译，比如导航栏和类别名称。

又一个好消息，把没翻译的地方告诉 AI，又马上就给修正了。

搞完了 i18n，再给网站加个管理页面。虽然 django 自带了后台管理页面，但那个是数据模型层面的，程序员用用还行，要是网店运营人员想要上架下架商品、变更产品类目，从那里面改就太麻烦了。所以让 AI 给我们加个更人性化的。

这个需求不止是后端的任务，除了要新增权限管理和一整套数据接口，还要做一套独立于用户端页面的管理员页面，属于全栈开发了。

GLM-5.1 又花了20多分钟，完成了管理页面。

到这一步，一个独立电商站的核心功能基本就实现了。虽然离完全上线还有一些需要完善的部分，但从目前的表现来看，这种级别的开发复杂度 GLM-5.1 是足以胜任的，无非就是再根据需求和细节多进行几轮对话。

说下我用下来的整体感受：

首先自然是效率的极大提升。

在这次开发中，AI 一共思考了大约1.5~2小时，烧掉了20M+ tokens（主要是缓存），完成的工作量要我来做的话，完全不摸鱼估计也得要个3~5天。单就成本来说是大大降低了的。

对于非程序员来说，这不仅仅是效率的变化，更是门槛的降低。过去得找人来做的事，现在只要了解一些基本的概念和操作，就能在很短时间内自己搓一个出来，后续想增改功能也没问题。

但假如 AI 无法在长任务上保证质量，那 AI 就还只是一个工具，你给它要求，它给你结果。一旦要求太多太复杂，它就可能跑偏或打转，做了后面忘了前面，调来调去也没法收敛到想要的结果上。

现在 GLM-5.1 对于长程复杂任务的能力提升，让 AI 开发的实用范围进一步拓展。我明显感觉那种反复修改的情况少很多了。

如果说以前的 AI 像一个聪明的实习生，帮你各种打下手，那现在的 GLM-5.1 就越来越像一个真正的软件工程师了，会帮你规划项目、明确自己的目标、清楚目前的进度，遇到问题后也能有有针对性地进行修正。这不仅仅是“写代码”，而是正儿八经“做项目”了。

现在我做这种网站项目，包括有界面的客户端项目，基本上就是：

智谱这套编程模型组合拳着实打在了深度开发的痛点上。

最后我想说，站在开发者的角度来看，当 AI 在编码能力已经越来越接近人类程序员的时候，跟 AI 去比写代码已经没有意义了。我们更需要像项目经理一样，用软件工程的方法去管理开发，用好各有所长的 AI “员工”。

这些员工也还在不停地成长和晋升。未来会到什么程度，我也说不准，拭目以待吧。

GLM-5V-Turbo + GLM-5.1，智谱这俩新模型把深度开发玩明白了

相关推荐