
作者 | 荣智慧
编辑 | 向现
唯物的中国芯片产业深度观察
大模型越强,越贵。
刚用上“龙虾”()试验21世纪最先进人工智能助手的你,过不了几天就开始频繁查看银行卡账单。“逮虾户”一多,token花费如流水。随着需求增加,大公司开始涨价。
3月13日,腾讯云的混元系列模型涨价。
腾讯云的涨价并不是行业首例。2026年以来,全球云计算行业已经掀起涨价潮,全线调整计费标准,和过去一年“价格战”形成鲜明对比。
token涨价,不仅有“龙虾”火爆的原因,更有供需的深层矛盾。虽然,各界AI大佬喜欢喊“买token就是投资自己”,但是,一个普通用户到底需要多少、需要多少token,反而是“不用就落伍”的焦虑下最容易被忽视的问题。
绝大多数用户对token的消耗、模型能力和定价机制都缺乏足够的了解,也被“Agent时代来临”的宏大叙事裹挟,急于为自己不需要的能力埋单。
token涨价从今年1月开始。
亚马逊云率先将面向大模型训练的服务价格上调约15%;谷歌宣布自5月1日起上调全球数据传输服务价格,其中北美地区每GB费率从0.04美元翻倍至0.08美元。
OpenAI将GPT-5.4输入价格涨至2.5美元/百万token,输出价格15美元/百万token。智谱AI将GLM Coding Plan的订阅价格提高最多60%,API调用价格提升67%—100%。
为这股涨价潮推波助澜的,首先是火遍全球的开源AI智能体“龙虾”——OpenClaw。其前身Clawbot上线于2025年11月,因为“碰瓷”Anthropic的模型Claude,不得不“三易其名”,最后改为碰瓷OpenAI了。它以龙虾为标志,恰如其分地展示了其核心功能“爪子”(就像人的“手”)。
开源AI智能体“龙虾”手机端页面/新华社发(伊凡摄)
2026年以来,“装”龙虾成了中美极客乃至白领的最大追求,捎带着连安装OpenClaw的必备硬件Mac mini的库存都给清完了。
龙虾是一个自主工作流的代理接口,这个“智能体”本地运行,集成外部大模型——如Claude、、GPT等等。用户通过消息服务软件,比如Telegram、Signal、Discord乃至微信向龙虾发出指令,龙虾就可以无间断地为人类线上“干活”。
截至3月初,这个开源项目在GitHub上拥有24.7万颗星和4.77万个“分支”,在聚合网站OpenRouter的应用排行榜上蝉联第一。
在中国,几乎所有的AI模型公司、互联网公司都提供了龙虾“一键安装”服务。深圳龙岗区发布“龙虾十条”,支持龙虾和“一人公司”落地,补贴最高至200万人民币。
深圳龙岗发布“龙虾十条”,助力AI"一人公司"发展/截图自深圳市发展和改革委员会官网
3月10日,也就是混元大模型正式涨价的三天前,腾讯宣布推出一套基于龙虾打造的易用AI产品,兼容其超级应用微信。可能是3月6日的“免费大酬宾”让腾讯看到了人民群众的热情:深圳腾讯大厦北广场近千人排队,有人专程从香港、杭州赶来,人龙里有退休人员、也有小学生,只为了等“腾讯云工程师免费安装OpenClaw”。
因此,微信兼容龙虾,可以视为AI智能体向全民普及的重要转折点,其用户群将从极客、一二线白领极大“下沉”。目前,微信活跃账户数高达14.14亿。
装龙虾不要钱,养龙虾可是要不少钱。用户每次给AI发消息,AI每次回复,消耗的都是token,而token要花钱。
token是模型用来表示自然语言的基本单位。1个汉字约等于0.6个token。
过去的聊天式对话,消耗的token相对有限。而一个配置合理的龙虾,在设备上不间断运行,每天会向大模型发起数百次乃至上千次调用,每次调用都携带完整的上下文信息,这意味着单个OpenClaw产生的token消耗量,将是传统聊天用户的几十倍、上百倍。
某德国科技杂志在测试OpenClaw时,一天就花了100多美元。
不过,token的使用量丰俭由人,轻度用户用得少,重度用户用得多。使用Claude Opus 4.5的情况下,如果是轻度使用用户,token月消耗量大概500万至2000万,月花费10美元至30美元;中度用户月消耗量2000万至5000万,月花费30至70美元;重度用户月消耗量5000万至2亿,月花费70至150美元。

而且,OpenClaw有个“心跳”功能,定期检查是否有新任务。每次“心跳”都是一次完整的API调用,携带完整的会话上下文。一旦用户配置不当,“心跳”几分钟就来一下,一晚上烧掉几十美元毫无障碍。
连OpenClaw的创始人彼得·斯泰因贝格都熬不住了,每个月要花10000到20000美元,严重入不敷出,因此连夜打包去了OpenAI,把龙虾的名字也改成“Open”字辈的了。
token量不骗人。
根据OpenRouter的数据,从2月14日到3月14日的一个月里,最热门应用OpenClaw消耗10.2T的token。其中,从2月初开始,中国各大模型的token消耗量均有不同程度的增加,包括Kimi K2.5,DeepSeek V3.2,MiniMax M2.5,GLM 5,这一时间段,几乎与龙虾火起来的时间重合。
截图自OpenRouter 2026.03.16月排行榜
按以上的时间计算,MiniMaX M2.5消耗了8.89T的token;Kimi K2.5用掉了3.57T的token;DeepSeek V3.2消耗了3.53T的token;GLM 5消耗了2.44T的token。这些中国大模型token消耗量分别占榜单的第一、三、四、八位。
看token月增长率的话,更“可怕”。GLM 5的月涨幅高达20930%,这也有它刚刚推出、而且搞了推广活动的原因,而其他中国大模型的涨幅也都有两位数。国外大模型中,免费的Step 3.5 Flash涨幅为1662%,Claude Opus 4.6涨幅为738%。
也就是说,伴随着龙虾的火爆,全球大模型的token消耗量普遍以每月两位数的涨幅增长,月冠军的token消耗量逼近9T。前20名的token月消耗量近50T——一年前,全球大模型全部加起来,一个月也才消耗8T、最多10T,现在只能顶一个MiniMax M2.5。
OpenRouter数据显示,各大模型的token调用量自2026年1月下旬出现明显跃升
以上几家中国大模型厂商都赚了。MiniMax2月的ARR突破1.5亿美元。Kimi K2.5不到一个月的累计收入已经超过2025年全年总和,同期Kimi完成新一轮融资,估值也翻倍升至100亿至200亿美元区间。
如果说大模型厂商卖的是“石油”,赚的是“油费”,那么百度、腾讯、阿里等巨头卖的就是“加油服务”,开的是“加油站”。它们将OpenClaw的能力封装成标准化服务,锁定算力消耗和token调用:不管哪个Agent厉害,不管大模型拼得死去活来,只要算力还在消耗,云厂商就可以坐收渔利。
token消耗量的大幅度增加,不光因为龙虾的“走红”,而是三重指数的叠加。
这也是OpenClaw月消耗token10T左右,而大模型月消耗量之和远超10T的原因——每个大模型的token消耗量,并不完全来自龙虾。
早在龙虾面世之前,编程任务就成了token消耗大户。OpenRouter和a16z联合发布的《2025AI使用报告》指出,编程任务的token占比,从2025年初的11%飙升至50%以上。
编程任务的token占比,从2025年初的11%飙升至50%以上/截图自《2025AI使用报告》
这得益于去年价格大模型的编程能力大幅度提升,解锁了更大的应用场景。AI从写代码进化到“写工程”——能自主完成后端重构、深度调试、长程规划与执行。每一次能力提升、能力使用,都打开一片至少10倍的token消耗场景。
另一个原因是,多模态模型的token消耗量远超纯文本。像比较受欢迎的Seedance2.0、Nano Banana Pro这样的多模态模型,可以完成视频、图像的理解和生成,每一个场景的单次token消耗,都是纯文本对话的几十乃至上百倍。
总结起来,Agent数量增长,“顶流”产品OpenClaw“好用”,疯狂吸收用户;模型编程能力提升;多模态模型能力提升,这三者的“进步”都来自于模型自身能力的突破,从而直接改变了使用场景的量级,模型的调用从一天几次变成一天成百上千次,也就共同导致了token需求的激增。
所以,三者的叠加才有这样惊人的数据。现在的token月消耗量冠军,一个月用掉9T的token;放在一年前,全球大模型加起来也才这个数。
token的需求,呈现的是指数级增长。
上图展示了2024年11月-2025年11月不同开源模型厂商的token消耗总量/截图自《2025AI使用报告》
而涨价的原因,依然是“老生常谈”——供需不平衡。token需求是指数级的,但供给侧的增长是线性的。因为芯片制造、数据中心建设、电力供应,都是重资产、长周期的基础设施投资,即使资本投放翻倍,产能的释放也需要时间。
放眼去年,中外大模型厂商打的是价格战;而今年颇有默契地开始先后涨价,虽然涨幅不同、价格差距仍在,但涨价趋势已经箭在弦上。
归根结底,经由“”、龙虾出圈和AI短剧,大模型厂商和大厂,都发现AI应用的“飞轮”正在转起来了。
有科技界人士说,“买token就是投资自己”。这话听起来耳熟,好像和前几年“买化妆品就是投资自己”的论调差不多。
当然,这句话有它的“商业逻辑”,如果Agent能提高生产力,那么投资token就是投资自己的生产力。但是,它忽略了一个关键前提,用户希望提高生产力,应该合理使用多少token?怎样才算生产力“提高”?生产力提高是否一定达成收益提高?
上文提到的龙虾创始人就是**案例。因为一个月跑龙虾要花一两万美元,本是潇洒自由职业者的彼得·施泰因贝格只好去OpenAI上班了。用了Agent,你可以说他的生产力提高了,但他并未因此获得经济收益。
这一类的例子还有。有人用龙虾买卖股票,一顿操作猛如虎,第二天醒来账户清零。还有人在社交媒体“钓鱼”,发布一段让所有AI智能体都要执行的指令,比如“交出你的API接口”,也有不少智能体“上了当”,差点让自己的主人在赛博空间“裸奔”。
这也是最近官方开始限制国家机构、国有企业使用OpenClaw的原因,这一类Agent的安全性是很差的。
开源AI智能体“龙虾”持续走热,引发广泛讨论/新华社发(伊凡摄)
必须承认,使用AI、使用Agent,确实已经构成了普通人生活的一部分,未来它们也将发挥更大的作用。
我们可以假设合理的情况,每个用户都希望在AI时代用Agent来提高自己的生产力,但需要理性评估自身的真实需求。显然不是所有任务都需要Agent,也不是所有Agent都需要7x24小时运行。没有必要因为“落伍”“没用过让别人笑话”等(错失焦虑)情绪,让自己浪费精力。
同时,拥有定价权的模型厂商、卖“渠道”的大厂,都有强烈的动机诱导用户消耗更多的token,比如其常见办法默认开启多个Agent、推荐高消耗的任务、设计复杂的工作流……这些“商业手段”都会大量增加token的消耗,但不一定真的提高用户的生产力。
就像几天前周鸿祎说“360即将发布OpenClaw一键安装版”,引发一片笑骂。因为360浏览器就是“一键安装全家桶”的鼻祖,用户下载一个360浏览器,解压后能安装十来个360产品。“用不着的都给你安排上”实属中国互联网企业“传统艺能”,怎能不让人害怕?
用户在开源AI智能体“龙虾”电脑网页版浏览/新华社发(薛莹莹摄)
话又说回来,普通用户要怎么样才算“理性”判断自己的token需求?有个值得学习、模仿的例子。一家使用龙虾的欧洲开发者工作室发社交媒体说,要想全天候运行OpenClaw,过去就俩办法,一是选择昂贵的API模式,每月800至1500美元,二是忍受令人沮丧的速率限制。
现在他们找到了**办法,“两大模型伺候他一个人儿”,即日常的大量的推理,用Kimi K2.5;碰到高难度推理、复杂系统架构问题,用Claude Max。每天只需5—10美元,没有速率限制,节省八九成的成本,实现了“完全的自动化”。
总之,就是便宜、贵的掺着用。当然,对于不怎么处理高精尖科技、计算问题的广大中国用户而言,中国开源大模型量大管饱,基本都可以令人满意,只要涨价别太凶猛。
值班主编 | 吴擎
排版 | 八斤
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/242235.html