‘龙虾’AI智能体爆火推动推理算力需求超越训练算力,根本原因在于智能体从“能聊天”进化到“能干活”,推理过程从单次调用变成了持续消耗。这背后是一场从“训练模型”到“训练智能体”的范式革命,让算力需求的重心发生了根本性转移。
智能体范式转变
行业正在从训练模型的时代,走向训练智能体的时代,其定义特征是跟真实世界的闭环交互。这意味着,AI的核心任务变了。
过去,大模型的目标是“思考得足够久”,评判标准是能否解出难题或通过基准测试。而现在,像OpenClaw这样的智能体,其思维是为了行动而思考。它关注的是模型能否在与环境交互的过程中持续取得进展,核心问题从“模型能否思考得足够久?”
转变为“模型能不能用一种撑得起有效行动的方式来思考?”
智能体式思考关注的是:模型能否在与环境交互的过程中持续取得进展。
这种转变让优化对象从单一的模型,变成了“模型加环境的整个系统”。训练只是造出一个聪明的大脑,而让这个大脑在真实世界里持续工作、做出有效决策,才是智能体落地后的日常,这全靠推理算力来支撑。
Token消耗激增
范式转变直接体现在算力消耗的量级上。智能体不再是聊一句就停的助手,而是7×24小时持续工作的“数字员工”。
- 任务复杂度高:完成一个复杂任务(如规划旅行、处理邮件)需要智能体进行多步骤自主规划、工具调用和结果验证,涉及成百上千次的模型推理调用。
- 持续交互特性:根据华泰证券测算,AI智能体的Token消耗量相较聊天机器人提升超10倍。一个复杂任务跑下来,其算力消耗可能是普通对话的百倍乃至千倍。
市场数据印证了这种需求的爆发:OpenClaw相关调用量在3月单周达3.14T Tokens,环比增长30%。需求的激增也传导至价格端,近期国内主要云服务商纷纷宣布上调AI算力及存储服务价格,涨幅最高达34%。这反映出推理算力供需关系的紧张。
产业响应与趋势
产业界已清晰认识到这一趋势。英伟达CEO黄仁勋指出,AI推理市场拐点已经到来,AI正从训练阶段全面进入推理与执行阶段。国际数据公司(IDC)预测,到2027年,我国推理算力占整体算力的比例将突破70%。
为应对推理需求,硬件基础设施正在快速迭代。英伟达推出了专注于“极致低延迟Token生成”的Groq 3 LPU推理芯片,与GPU分工协作,以优化推理场景的效率。国内厂商也在围绕推理架构进行创新,追求极致的性价比。
同时,政策层面也在推动智能体落地,深圳、无锡、杭州等地相继发布支持OpenClaw发展的措施。这进一步加速了智能体从技术概念走向规模化应用,而每一个运行中的智能体实例,都在持续地消耗推理算力。
当数百万的智能体同时在各种场景中工作时,其聚合产生的、持续不断的推理算力需求,在规模上自然超越了周期性、集中式的训练算力投入。推理,而非训练,正成为AI基础设施竞争的新核心。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/260396.html