2026年龙虾已疯，吃不起了

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

作者 | 荣智慧

编辑 | 向现

唯物的中国芯片产业深度观察

大模型越强，越贵。

刚用上“龙虾”（）试验21世纪最先进人工智能助手的你，过不了几天就开始频繁查看银行卡账单。“逮虾户”一多，token花费如流水。随着需求增加，大公司开始涨价。

3月13日，腾讯云的混元系列模型涨价。

腾讯云的涨价并不是行业首例。2026年以来，全球云计算行业已经掀起涨价潮，全线调整计费标准，和过去一年“价格战”形成鲜明对比。

token涨价，不仅有“龙虾”火爆的原因，更有供需的深层矛盾。虽然，各界AI大佬喜欢喊“买token就是投资自己”，但是，一个普通用户到底需要多少、需要多少token，反而是“不用就落伍”的焦虑下最容易被忽视的问题。

绝大多数用户对token的消耗、模型能力和定价机制都缺乏足够的了解，也被“Agent时代来临”的宏大叙事裹挟，急于为自己不需要的能力埋单。

token涨价从今年1月开始。

亚马逊云率先将面向大模型训练的服务价格上调约15%；谷歌宣布自5月1日起上调全球数据传输服务价格，其中北美地区每GB费率从0.04美元翻倍至0.08美元。

OpenAI将GPT-5.4输入价格涨至2.5美元/百万token，输出价格15美元/百万token。智谱AI将GLM Coding Plan的订阅价格提高最多60%，API调用价格提升67%—100%。

为这股涨价潮推波助澜的，首先是火遍全球的开源AI智能体“龙虾”——OpenClaw。其前身Clawbot上线于2025年11月，因为“碰瓷”Anthropic的模型Claude，不得不“三易其名”，最后改为碰瓷OpenAI了。它以龙虾为标志，恰如其分地展示了其核心功能“爪子”（就像人的“手”）。

开源AI智能体“龙虾”手机端页面/新华社发（伊凡摄）

2026年以来，“装”龙虾成了中美极客乃至白领的最大追求，捎带着连安装OpenClaw的必备硬件Mac mini的库存都给清完了。

龙虾是一个自主工作流的代理接口，这个“智能体”本地运行，集成外部大模型——如Claude、、GPT等等。用户通过消息服务软件，比如Telegram、Signal、Discord乃至微信向龙虾发出指令，龙虾就可以无间断地为人类线上“干活”。

截至3月初，这个开源项目在GitHub上拥有24.7万颗星和4.77万个“分支”，在聚合网站OpenRouter的应用排行榜上蝉联第一。

在中国，几乎所有的AI模型公司、互联网公司都提供了龙虾“一键安装”服务。深圳龙岗区发布“龙虾十条”，支持龙虾和“一人公司”落地，补贴最高至200万人民币。

深圳龙岗发布“龙虾十条”，助力AI"一人公司"发展/截图自深圳市发展和改革委员会官网

3月10日，也就是混元大模型正式涨价的三天前，腾讯宣布推出一套基于龙虾打造的易用AI产品，兼容其超级应用微信。可能是3月6日的“免费大酬宾”让腾讯看到了人民群众的热情：深圳腾讯大厦北广场近千人排队，有人专程从香港、杭州赶来，人龙里有退休人员、也有小学生，只为了等“腾讯云工程师免费安装OpenClaw”。

因此，微信兼容龙虾，可以视为AI智能体向全民普及的重要转折点，其用户群将从极客、一二线白领极大“下沉”。目前，微信活跃账户数高达14.14亿。

装龙虾不要钱，养龙虾可是要不少钱。用户每次给AI发消息，AI每次回复，消耗的都是token，而token要花钱。

token是模型用来表示自然语言的基本单位。1个汉字约等于0.6个token。

过去的聊天式对话，消耗的token相对有限。而一个配置合理的龙虾，在设备上不间断运行，每天会向大模型发起数百次乃至上千次调用，每次调用都携带完整的上下文信息，这意味着单个OpenClaw产生的token消耗量，将是传统聊天用户的几十倍、上百倍。

某德国科技杂志在测试OpenClaw时，一天就花了100多美元。

不过，token的使用量丰俭由人，轻度用户用得少，重度用户用得多。使用Claude Opus 4.5的情况下，如果是轻度使用用户，token月消耗量大概500万至2000万，月花费10美元至30美元；中度用户月消耗量2000万至5000万，月花费30至70美元；重度用户月消耗量5000万至2亿，月花费70至150美元。

而且，OpenClaw有个“心跳”功能，定期检查是否有新任务。每次“心跳”都是一次完整的API调用，携带完整的会话上下文。一旦用户配置不当，“心跳”几分钟就来一下，一晚上烧掉几十美元毫无障碍。

连OpenClaw的创始人彼得·斯泰因贝格都熬不住了，每个月要花10000到20000美元，严重入不敷出，因此连夜打包去了OpenAI，把龙虾的名字也改成“Open”字辈的了。

token量不骗人。

根据OpenRouter的数据，从2月14日到3月14日的一个月里，最热门应用OpenClaw消耗10.2T的token。其中，从2月初开始，中国各大模型的token消耗量均有不同程度的增加，包括Kimi K2.5，DeepSeek V3.2，MiniMax M2.5，GLM 5，这一时间段，几乎与龙虾火起来的时间重合。

截图自OpenRouter 2026.03.16月排行榜

按以上的时间计算，MiniMaX M2.5消耗了8.89T的token；Kimi K2.5用掉了3.57T的token；DeepSeek V3.2消耗了3.53T的token；GLM 5消耗了2.44T的token。这些中国大模型token消耗量分别占榜单的第一、三、四、八位。

看token月增长率的话，更“可怕”。GLM 5的月涨幅高达20930%，这也有它刚刚推出、而且搞了推广活动的原因，而其他中国大模型的涨幅也都有两位数。国外大模型中，免费的Step 3.5 Flash涨幅为1662%，Claude Opus 4.6涨幅为738%。

也就是说，伴随着龙虾的火爆，全球大模型的token消耗量普遍以每月两位数的涨幅增长，月冠军的token消耗量逼近9T。前20名的token月消耗量近50T——一年前，全球大模型全部加起来，一个月也才消耗8T、最多10T，现在只能顶一个MiniMax M2.5。

OpenRouter数据显示，各大模型的token调用量自2026年1月下旬出现明显跃升

以上几家中国大模型厂商都赚了。MiniMax2月的ARR突破1.5亿美元。Kimi K2.5不到一个月的累计收入已经超过2025年全年总和，同期Kimi完成新一轮融资，估值也翻倍升至100亿至200亿美元区间。

如果说大模型厂商卖的是“石油”，赚的是“油费”，那么百度、腾讯、阿里等巨头卖的就是“加油服务”，开的是“加油站”。它们将OpenClaw的能力封装成标准化服务，锁定算力消耗和token调用：不管哪个Agent厉害，不管大模型拼得死去活来，只要算力还在消耗，云厂商就可以坐收渔利。

token消耗量的大幅度增加，不光因为龙虾的“走红”，而是三重指数的叠加。

这也是OpenClaw月消耗token10T左右，而大模型月消耗量之和远超10T的原因——每个大模型的token消耗量，并不完全来自龙虾。

早在龙虾面世之前，编程任务就成了token消耗大户。OpenRouter和a16z联合发布的《2025AI使用报告》指出，编程任务的token占比，从2025年初的11%飙升至50%以上。

编程任务的token占比，从2025年初的11%飙升至50%以上/截图自《2025AI使用报告》

这得益于去年价格大模型的编程能力大幅度提升，解锁了更大的应用场景。AI从写代码进化到“写工程”——能自主完成后端重构、深度调试、长程规划与执行。每一次能力提升、能力使用，都打开一片至少10倍的token消耗场景。

另一个原因是，多模态模型的token消耗量远超纯文本。像比较受欢迎的Seedance2.0、Nano Banana Pro这样的多模态模型，可以完成视频、图像的理解和生成，每一个场景的单次token消耗，都是纯文本对话的几十乃至上百倍。

总结起来，Agent数量增长，“顶流”产品OpenClaw“好用”，疯狂吸收用户；模型编程能力提升；多模态模型能力提升，这三者的“进步”都来自于模型自身能力的突破，从而直接改变了使用场景的量级，模型的调用从一天几次变成一天成百上千次，也就共同导致了token需求的激增。

所以，三者的叠加才有这样惊人的数据。现在的token月消耗量冠军，一个月用掉9T的token；放在一年前，全球大模型加起来也才这个数。

token的需求，呈现的是指数级增长。

上图展示了2024年11月-2025年11月不同开源模型厂商的token消耗总量/截图自《2025AI使用报告》

而涨价的原因，依然是“老生常谈”——供需不平衡。token需求是指数级的，但供给侧的增长是线性的。因为芯片制造、数据中心建设、电力供应，都是重资产、长周期的基础设施投资，即使资本投放翻倍，产能的释放也需要时间。

放眼去年，中外大模型厂商打的是价格战；而今年颇有默契地开始先后涨价，虽然涨幅不同、价格差距仍在，但涨价趋势已经箭在弦上。

归根结底，经由“”、龙虾出圈和AI短剧，大模型厂商和大厂，都发现AI应用的“飞轮”正在转起来了。

有科技界人士说，“买token就是投资自己”。这话听起来耳熟，好像和前几年“买化妆品就是投资自己”的论调差不多。

当然，这句话有它的“商业逻辑”，如果Agent能提高生产力，那么投资token就是投资自己的生产力。但是，它忽略了一个关键前提，用户希望提高生产力，应该合理使用多少token？怎样才算生产力“提高”？生产力提高是否一定达成收益提高？

上文提到的龙虾创始人就是**案例。因为一个月跑龙虾要花一两万美元，本是潇洒自由职业者的彼得·施泰因贝格只好去OpenAI上班了。用了Agent，你可以说他的生产力提高了，但他并未因此获得经济收益。

这一类的例子还有。有人用龙虾买卖股票，一顿操作猛如虎，第二天醒来账户清零。还有人在社交媒体“钓鱼”，发布一段让所有AI智能体都要执行的指令，比如“交出你的API接口”，也有不少智能体“上了当”，差点让自己的主人在赛博空间“裸奔”。

这也是最近官方开始限制国家机构、国有企业使用OpenClaw的原因，这一类Agent的安全性是很差的。

开源AI智能体“龙虾”持续走热，引发广泛讨论/新华社发（伊凡摄）

必须承认，使用AI、使用Agent，确实已经构成了普通人生活的一部分，未来它们也将发挥更大的作用。

我们可以假设合理的情况，每个用户都希望在AI时代用Agent来提高自己的生产力，但需要理性评估自身的真实需求。显然不是所有任务都需要Agent，也不是所有Agent都需要7x24小时运行。没有必要因为“落伍”“没用过让别人笑话”等（错失焦虑）情绪，让自己浪费精力。

同时，拥有定价权的模型厂商、卖“渠道”的大厂，都有强烈的动机诱导用户消耗更多的token，比如其常见办法默认开启多个Agent、推荐高消耗的任务、设计复杂的工作流……这些“商业手段”都会大量增加token的消耗，但不一定真的提高用户的生产力。

就像几天前周鸿祎说“360即将发布OpenClaw一键安装版”，引发一片笑骂。因为360浏览器就是“一键安装全家桶”的鼻祖，用户下载一个360浏览器，解压后能安装十来个360产品。“用不着的都给你安排上”实属中国互联网企业“传统艺能”，怎能不让人害怕？

用户在开源AI智能体“龙虾”电脑网页版浏览/新华社发（薛莹莹摄）

话又说回来，普通用户要怎么样才算“理性”判断自己的token需求？有个值得学习、模仿的例子。一家使用龙虾的欧洲开发者工作室发社交媒体说，要想全天候运行OpenClaw，过去就俩办法，一是选择昂贵的API模式，每月800至1500美元，二是忍受令人沮丧的速率限制。

现在他们找到了**办法，“两大模型伺候他一个人儿”，即日常的大量的推理，用Kimi K2.5；碰到高难度推理、复杂系统架构问题，用Claude Max。每天只需5—10美元，没有速率限制，节省八九成的成本，实现了“完全的自动化”。

总之，就是便宜、贵的掺着用。当然，对于不怎么处理高精尖科技、计算问题的广大中国用户而言，中国开源大模型量大管饱，基本都可以令人满意，只要涨价别太凶猛。

值班主编 | 吴擎

排版 | 八斤

2026年龙虾已疯，吃不起了

相关推荐