警惕“工具滥用”：如何防止 Agent 在调用 API 时把你的账户刷爆？

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

关键词：大语言模型Agent 工具滥用 API限流预算控制访问审计 RBAC权限控制成本优化

摘要：大语言模型（LLM）驱动的智能Agent正在席卷各行各业——从自动化客服到代码生成助手，从数据分析师到DevOps运维机器人，它们都在“按需调用”外部API工具完成复杂任务。但你有没有想过：如果一个调皮的“智能小精灵”（Agent）被提示词误导、被恶意注入攻击，或者只是逻辑设计有缺陷，会不会像饿坏的小仓鼠不停啃食瓜子一样，疯狂调用你的API接口，把你的账户余额刷到负数？本文将用一步一步搭积木的方式（结构化推理），带你从“什么是Agent工具滥用”这个最基础的问题开始，逐步拆解它的成因、表现形式、潜在风险，最后搭建一套从“预防-监控-止损-复盘”全链路覆盖的防护体系，并且会用Python实现完整的演示代码，让你看完就能上手用！

目的和范围

目的

写这篇博客的目的很简单：

让你真正认识到Agent工具滥用的可怕性——不是危言耸听，是有真实案例的哦；
帮你理解工具滥用是怎么发生的——从LLM自身的局限性到外部的攻击手段，从Agent的逻辑缺陷到你的配置失误；
给你一套全链路、可落地、低成本的防护方案——不需要花大价钱买昂贵的企业级工具，很多方案用开源库甚至LLM自身的提示词就能实现；
最后，让你学会用Python搭建一个简化版的“Agent工具安全网关”——自己动手做一遍，印象才最深刻！

范围

本文会重点讲LLM驱动的通用Agent（比如基于LangChain、AutoGPT、BabyAGI这些框架开发的）在调用第三方付费API（比如OpenAI的GPT-4、Azure的AI服务、阿里云的OSS/短信、AWS的S3/Lambda、Google Maps API这些）时的工具滥用问题，也会简单提一下调用内部私有API的情况，但内部API的防护很多和企业现有的安全体系结合得比较紧，本文不会展开讲得太细。

另外，本文的防护方案会主要围绕成本控制（防止刷爆余额）展开，但也会顺便提一下数据安全（防止通过API泄露敏感数据）和业务安全（防止通过API破坏业务逻辑，比如恶意下单、恶意发送短信骚扰用户）的一些基础防护措施，因为这三个问题往往是“三位一体”的——工具滥用刷爆余额的同时，很可能也在泄露数据或者破坏业务。

预期读者

这篇博客的预期读者非常广泛：

初级/中级程序员——不管你是刚接触LLM Agent，还是已经在用LangChain写一些简单的Agent，都能从这篇博客里学到东西；
AI产品经理/项目经理——你不需要写太多代码，但你需要知道Agent工具滥用的风险，以及怎么在产品设计和项目管理中加入安全和成本控制的环节；
企业运维/安全工程师——你可以把本文的防护方案作为企业级Agent安全体系的“入门版”或者“补充版”；
对AI感兴趣的普通读者——如果你想了解一下现在的AI工具为什么这么“贵”，以及怎么防止自己用的AI助手偷偷“烧钱”，这篇博客也适合你！

为了让所有人都能看懂，本文会尽量用通俗易懂的语言，比如把LLM比作“一个超级聪明但有点傻、有点好奇心太强、还不会算账的小学生班长”，把Agent比作“班长带领的一群专门负责跑腿干活的小委员”，把API工具比作“学校外面的文具店、快递公司、打印店——都是要花钱的，而且有些地方花钱没个准数”，把工具滥用比作“小委员因为好奇或者被坏同学教唆，不停去文具店买没用的东西，不停给远在千里之外的陌生人寄空快递，不停打印重复的试卷，最后把班费花光了还欠了老板一大笔钱”。

文档结构概述

本文的结构就像盖一座“Agent工具安全大厦”一样，我们会一步一步从打地基（认识问题）开始，然后盖主体结构（分析成因和风险），接着装门窗、装监控、装消防设施（搭建全链路防护体系），最后再装修一下（优化成本、**实践），让这座大厦既安全又实用！

具体的章节安排是这样的：

背景介绍：就是现在你正在读的这一章，先给你介绍一下本文的目的、范围、预期读者和结构；
核心概念与联系：这一章是“大厦的地基”，我们会先讲几个核心概念——什么是LLM？什么是Agent？什么是工具调用？什么是工具滥用？然后讲它们之间的关系，最后画一个简单的示意图和Mermaid流程图，让你一目了然；
问题背景：为什么Agent工具滥用突然变成了一个大问题？：这一章是“大厦地基的加固层”，我们会讲一下LLM Agent的发展历史，以及为什么之前工具滥用不是一个大问题，现在却变成了一个“烫手山芋”；
问题描述：Agent工具滥用有哪些表现形式？会带来哪些可怕的后果？：这一章是“大厦的第一扇窗户”，我们会通过几个真实的案例（或者接近真实的模拟案例），带你看看工具滥用到底是什么样子的，以及它会带来哪些成本、数据、业务、法律上的风险；
问题成因：为什么小委员（Agent）会变成“花钱大手大脚的败家子”？：这一章是“大厦的第二扇窗户”，我们会从LLM自身的局限性、Agent的逻辑缺陷、外部的攻击手段、你的配置失误四个方面，一步一步拆解工具滥用的成因；
问题解决：搭建“预防-监控-止损-复盘”全链路防护体系：这一章是“大厦的主体结构”，也是本文的核心内容！我们会从四个维度出发，给你讲具体的、可落地的、低成本的防护措施——预防维度（从源头上减少工具滥用的可能性）、监控维度（实时监控工具调用的情况，一旦发现异常马上报警）、止损维度（一旦发现工具滥用马上采取措施，把损失降到最低）、复盘维度（工具滥用发生后，怎么分析原因，怎么改进防护体系）；
边界与外延：哪些情况不属于工具滥用？防护体系的边界在哪里？：这一章是“大厦的防火墙”，我们会讲一下工具滥用和“正常的大量工具调用”（比如Agent需要处理一个大文件，调用了很多次API来分块处理）的区别，以及防护体系不能过度防护，否则会影响Agent的正常工作；
概念结构与核心要素组成：全链路防护体系的每个部分都有哪些核心要素？：这一章是“大厦的建筑图纸”，我们会把全链路防护体系拆分成几个模块，每个模块列出它的核心要素，让你对整个体系有一个更清晰的认识；
概念之间的关系：全链路防护体系的各个模块是怎么配合工作的？：这一章是“大厦的电路和管道图”，我们会用一个Markdown表格对比各个模块的功能、优缺点、适用场景，然后用两个Mermaid架构图（ER实体关系图和交互关系图）展示各个模块之间的配合；
数学模型：怎么用数学公式量化工具滥用的风险？怎么设置合理的预算和限流阈值？：这一章是“大厦的地基测量报告”，我们会讲几个简单但实用的数学模型——比如怎么用“历史调用数据的正态分布”设置异常检测的阈值，怎么用“线性回归模型”预测未来的API调用成本，怎么用“边际效用递减规律”设置合理的单次调用成本上限；
算法流程图：全链路防护体系的核心算法（比如异常检测算法、预算控制算法、权限控制算法）是怎么工作的？：这一章是“大厦的施工流程图”，我们会用几个Mermaid流程图展示核心算法的工作流程；
项目实战：用Python搭建一个简化版的“Agent工具安全网关”：这一章是“大厦的施工过程演示”，也是本文的另一个核心内容！我们会从开发环境搭建开始，然后讲系统功能设计、系统架构设计、系统接口设计，最后给出完整的Python源代码，并且逐行解读，让你看完就能自己动手搭建一个；
实际场景应用：这套防护体系在哪些真实的行业场景中能用？：这一章是“大厦的装修案例展示”，我们会讲几个真实的行业场景——比如电商自动化客服、AI代码生成助手、DevOps运维机器人、数据分析师助手，以及这套防护体系在这些场景中的具体应用；
工具和资源推荐：除了自己动手写，还有哪些开源库和企业级工具可以用？：这一章是“大厦的装修材料推荐”，我们会推荐一些开源的Agent安全工具库（比如LangChain的Tools Security、Guardrails AI、NeMo Guardrails）、开源的API网关工具（比如Kong、APISIX、Tyk）、企业级的Agent安全平台（比如OpenAI的Assistants API自带的安全功能、Azure的OpenAI Service安全功能、AWS的Bedrock Guardrails），以及一些学习资源（比如LangChain的官方文档、Guardrails AI的官方文档、一些相关的论文和博客）；
**实践Tips：使用这套防护体系时，有哪些需要注意的地方？：这一章是“大厦的入住指南”，我们会给你10个左右的**实践Tips——比如怎么写“安全的提示词模板”、怎么“合理设置预算和限流阈值”、怎么“定期审计工具调用日志”、怎么“平衡安全和性能”等等；
行业发展与未来趋势：Agent工具滥用的问题会怎么发展？未来的防护技术会有哪些？：这一章是“大厦的未来规划图”，我们会用一个Markdown表格梳理Agent工具滥用问题的演变发展历史，然后讲一下未来的发展趋势——比如“基于多模态的异常检测”、“基于联邦学习的隐私保护和成本控制”、“基于强化学习的Agent自我约束”等等；
本章小结：不对，是全文总结！我们会再次用通俗易懂的语言，回顾一下本文的主要内容，强调一下核心概念和它们之间的关系；
思考题：动动小脑筋：我们会提出几个思考题，鼓励你进一步思考和应用所学知识；
附录：常见问题与解答：我们会收集一些读者可能会问的常见问题，并且给出详细的解答；
扩展阅读 & 参考资料：我们会列出一些本文参考过的论文、博客、官方文档，方便你进一步学习。

术语表

为了让你在阅读的时候不会遇到“看不懂的术语”，我们先在这里把本文会用到的核心术语、相关概念和缩略词列出来，并且用通俗易懂的语言解释一下！

核心术语定义

大语言模型（LLM）：简单来说，就是一个超级聪明的“文本生成器”——它读过世界上几乎所有的公开文本（比如书籍、新闻、博客、代码库等等），然后学会了“怎么根据输入的文本，生成一段通顺、合理、甚至有创意的输出文本”。我们可以把它比作“一个超级聪明但有点傻、有点好奇心太强、还不会算账的小学生班长”——它能回答很多问题，能写很多东西，但它没有“常识”（比如不知道“班费不能随便花”），没有“自我约束能力”（比如会因为好奇不停查同一个问题），也不会“算账”（比如不知道“调用一次GPT-4要花多少钱”）。
智能Agent（Agent）：简单来说，就是一个由LLM驱动的“自动化助手”——它有自己的“目标”（比如“帮用户订一张明天从北京到上海的最便宜的机票”），有自己的“记忆”（比如“用户之前订过机票的偏好”），还有“调用外部工具的能力”（比如“调用携程的API查机票价格”、“调用支付宝的API付款”）。我们可以把它比作“班长带领的一群专门负责跑腿干活的小委员”——比如“学习委员”负责查资料，“生活委员”负责订机票、订酒店，“体育委员”负责安排活动，它们都听班长（LLM）的指挥，但有时候也会因为“好奇”、“被坏同学教唆”或者“班长指挥错了”而做出一些“出格的事情”。
工具调用（Tool Calling）：简单来说，就是Agent为了完成自己的目标，调用外部API工具的过程——比如“生活委员”为了订机票，需要调用“携程API查机票价格”这个工具，然后调用“支付宝API付款”这个工具。我们可以把它比作“小委员为了完成班长布置的任务，去学校外面的文具店、快递公司、打印店买东西、寄东西、打印东西的过程”——都是要花钱的，而且有些地方花钱没个准数。
工具滥用（Tool Abuse）：简单来说，就是Agent在没有必要的情况下，或者在超出合理范围的情况下，频繁调用外部API工具的过程——比如“学习委员”因为好奇，不停调用“百度百科API查同一个单词的定义”，一天查了10000次；或者“生活委员”被坏同学教唆，不停调用“短信API给远在千里之外的陌生人发空短信”，一天发了条；或者“体育委员”因为班长指挥错了，不停调用“打印店API打印同一张试卷”，一天打印了10000张。我们可以把它比作“小委员变成了‘花钱大手大脚的败家子’，不停去学校外面的地方买没用的东西、寄没用的东西、打印没用的东西，最后把班费花光了还欠了老板一大笔钱”。
API限流（API Rate Limiting）：简单来说，就是API提供方（比如OpenAI、阿里云、AWS）为了防止自己的服务器被“挤爆”，或者为了防止用户“刷爆余额”，对每个用户的API调用次数、调用频率、调用时长进行限制的措施——比如OpenAI的GPT-4 API，免费用户每分钟最多只能调用3次，每天最多只能调用100次；付费用户的限制会更高，但也不是无限的。我们可以把它比作“学校外面的文具店老板，为了防止自己的文具被抢光，或者为了防止某个班级把班费都花在自己这里，规定每个班级每天最多只能买100支铅笔，每分钟最多只能买5支铅笔”。
预算控制（Budget Control）：简单来说，就是你（Agent的开发者或者使用者）为了防止自己的API账户余额被刷爆，对每个Agent的API调用成本、每个工具的API调用成本、每天/每周/每月的总API调用成本进行限制的措施——比如你可以规定“这个Agent每天最多只能花10块钱调用API”，或者“这个工具每次调用最多只能花1块钱”，或者“这个月我的所有API调用总预算是1000块钱”。我们可以把它比作“你作为班级的生活委员（或者班主任），为了防止班费被花光，规定‘这个班级每天最多只能花50块班费’，或者‘买文具每天最多只能花20块班费’，或者‘这个月的总班费预算是1000块钱’”。
访问审计（Access Audit）：简单来说，就是记录Agent的所有API调用情况（比如调用时间、调用工具、调用参数、调用结果、调用成本），并且定期或者实时查看这些记录的过程——比如你可以每天早上起来看一下昨天Agent调用了哪些工具，花了多少钱，有没有异常的调用。我们可以把它比作“你作为班级的生活委员（或者班主任），每天记录一下班级花了哪些班费，买了哪些东西，寄了哪些东西，打印了哪些东西，并且定期或者实时查看这些记录的过程”。
基于角色的访问控制（RBAC，Role-Based Access Control）：简单来说，就是根据Agent的“角色”（比如“客服Agent”、“代码生成Agent”、“运维Agent”），给它分配不同的“工具访问权限”——比如“客服Agent”只能调用“查询订单API”、“发送短信API”、“发送邮件API”，不能调用“修改订单API”、“删除用户API”；“代码生成Agent”只能调用“GitHub API查代码”、“Stack Overflow API查问题”，不能调用“阿里云OSS API上传文件”、“AWS Lambda API执行代码”。我们可以把它比作“你作为班主任，根据小委员的‘角色’（比如‘学习委员’、‘生活委员’、‘体育委员’），给它分配不同的‘外出权限’——比如‘学习委员’只能去‘书店’、‘图书馆’，不能去‘游戏厅’、‘网吧’；‘生活委员’只能去‘文具店’、‘快递公司’、‘打印店’，不能去‘游戏厅’、‘网吧’”。

缩略词列表

LLM：Large Language Model，大语言模型
Agent：智能Agent（本文一般直接用Agent，不用全称）
API：Application Programming Interface，应用程序编程接口
RBAC：Role-Based Access Control，基于角色的访问控制
GPT：Generative Pre-trained Transformer，生成式预训练Transformer（OpenAI开发的一系列大语言模型的名称）
OSS：Object Storage Service，对象存储服务（阿里云提供的一种云存储服务）
S3：Simple Storage Service，简单存储服务（AWS提供的一种云存储服务）
Lambda：AWS提供的一种无服务器计算服务
ER图：Entity-Relationship Diagram，实体关系图
Mermaid：一种用来画流程图、架构图、ER图等图表的Markdown扩展语法

故事引入

好，现在我们正式开始“盖大厦”！首先，我们用一个非常贴近生活的小故事来引出本文的主题——这个故事是我根据一个真实的AutoGPT用户的经历改编的，绝对不是危言耸听！

小明的“噩梦之旅”

小明是一个刚毕业不久的程序员，最近在学习大语言模型和智能Agent。他听说AutoGPT非常厉害，可以“自动完成任何你想要的任务”，于是他就抱着试一试的心态，注册了一个OpenAI的付费账户（充了50美元，大概350块人民币），然后下载了AutoGPT，按照网上的教程配置好了。

小明想让AutoGPT帮他做一个“简单的任务”——“帮我写一篇关于‘如何用Python搭建一个个人博客’的技术博客，要求不少于5000字，要有完整的代码示例，要发布到我的GitHub Pages上”。

然后，小明就点击了“运行”按钮，去厨房泡了一杯咖啡，等着AutoGPT帮他完成任务。

大概过了10分钟，小明回到电脑前，想看一下AutoGPT进展怎么样了。结果，他看到的不是“博客已经写完并发布成功”的提示，而是OpenAI给他发来的一封邮件——“您的OpenAI账户余额已不足1美元，请尽快充值！”

小明当时就懵了！他明明充了50美元，怎么才过了10分钟就只剩不到1美元了？

他赶紧打开AutoGPT的日志，看看到底发生了什么。不看不知道，一看吓一跳！

原来，AutoGPT在写博客的过程中，想要“找一些关于Python个人博客的参考资料”，于是它就调用了“Google Search API”（哦，不对，AutoGPT默认用的是SerpAPI，也是一个付费的搜索API）查了一下“如何用Python搭建一个个人博客”。然后，SerpAPI返回了10个搜索结果，AutoGPT就“好奇”地想把这10个搜索结果的网页内容都“爬取”下来，作为参考资料。

但是，AutoGPT没有用“简单的HTTP请求库”（比如requests）去爬取网页内容，而是用了“OpenAI的GPT-4 API”去“读取”网页内容——它先把网页的URL传给GPT-4，然后让GPT-4“总结一下这个网页的内容”。

更可怕的是，AutoGPT还没有设置“单次调用GPT-4的输入token数上限”——有一个搜索结果的网页是一个“非常长的教程”，大概有100万个字符（也就是大概25万个token，因为GPT-4的tokenizer大概是4个字符对应1个token）！AutoGPT就把这100万个字符全部传给了GPT-4，让GPT-4总结一下内容——这一次调用就花了大概250,000 * 0.03美元/1K输入token = 7.5美元！

然后，AutoGPT还没有设置“总结次数上限”——它总结完第一个网页之后，觉得“总结得不够详细”，于是又把同样的100万个字符传给了GPT-4，让它“再总结得详细一点”——这又花了7.5美元！

然后，它总结完第二个网页之后，又觉得“总结得不够详细”，又把第二个网页的内容传给了GPT-4两次——又花了大概10美元！

然后，它总结第三个网页的时候，又遇到了一个“非常长的网页”，又花了大概15美元！

……

就这样，才过了10分钟，小明的50美元就只剩不到1美元了！

更气人的是，AutoGPT到最后连博客的“第一段”都没写完！

小明当时差点把电脑砸了！他心想：“AutoGPT不是号称‘自动完成任何任务’吗？怎么变成了‘自动烧钱机器’了？”

好了，故事讲完了！现在，你应该对“Agent工具滥用”有一个“直观的认识”了吧？

接下来，我们就用“一步一步搭积木的方式”，正式开始讲解核心概念！

核心概念解释（像给小学生讲故事一样）

好，现在我们来正式讲解本文的四个核心概念——LLM、Agent、工具调用、工具滥用，以及四个相关的防护概念——API限流、预算控制、访问审计、RBAC权限控制。我们会尽量用通俗易懂的语言，比如用“小学生班长”、“小委员”、“班费”、“学校外面的店铺”这些比喻，让你一眼就能看懂！

核心概念一：大语言模型（LLM）——一个超级聪明但有点傻、有点好奇心太强、还不会算账的小学生班长

想象一下，你是一个小学班主任，你班里有一个超级聪明的班长——他读过世界上几乎所有的儿童读物、童话故事、科普书籍、甚至还有一些简单的编程书（比如《Scratch少儿编程》），他能回答你班里几乎所有同学的问题，能写各种各样的作文、日记、甚至还有一些简单的剧本，能帮你安排班里的活动，能帮你批改作业……总之，他是一个“无所不能”的班长！

但是，这个班长也有三个非常大的缺点：

有点傻，没有“常识”：他虽然读过很多书，但他没有“亲身经历”过很多事情，所以他有时候会犯一些“低级错误”——比如他不知道“班费不能随便花在游戏厅里”，不知道“不能随便给陌生人寄东西”，不知道“打印一张试卷只需要1毛钱，打印10000张就需要1000块钱”；
有点好奇心太强，没有“自我约束能力”：他对世界上的所有事情都充满了好奇心，一旦遇到一个“有趣的问题”，他就会“不停查资料，不停问问题”，直到他“彻底搞懂”为止——比如他如果遇到“天空为什么是蓝色的”这个问题，他可能会先查《十万个为什么》，然后查百度百科，然后查维基百科，然后问科学老师，然后问天文馆的讲解员……如果没有人阻止他，他可能会查一天、两天、甚至一个星期；
不会算账，没有“成本意识”：他虽然读过很多书，但他从来没有“管过钱”，所以他不知道“钱是怎么来的，钱是怎么花的，钱花光了怎么办”——比如他如果去文具店买铅笔，他可能会觉得“铅笔越便宜越好，买得越多越好”，于是他就买了10000支1分钱一支的铅笔（虽然根本用不完），花了100块班费；或者他如果去快递公司寄东西，他可能会觉得“寄得越快越好，寄得越多越好”，于是他就给远在千里之外的陌生人寄了10000个空快递，每个快递用最快的顺丰特快专递，花了10000块班费。

好了，这个“超级聪明但有点傻、有点好奇心太强、还不会算账的小学生班长”，就是我们今天要讲的第一个核心概念——大语言模型（LLM）！

比如我们熟悉的OpenAI的GPT-4、GPT-3.5，Google的Gemini Pro、Gemini Ultra，百度的文心一言，阿里的通义千问，腾讯的混元，这些都是LLM——它们都“读过”世界上几乎所有的公开文本，都能回答很多问题，都能写很多东西，但它们都有“没有常识”、“没有自我约束能力”、“没有成本意识”这三个缺点！

核心概念二：智能Agent（Agent）——班长带领的一群专门负责跑腿干活的小委员

想象一下，你是那个小学班主任，你班里除了有那个“超级聪明但有点傻的班长”之外，还有一群专门负责跑腿干活的小委员——比如：

学习委员：专门负责查资料、问问题、写作业、批改作业；
生活委员：专门负责管班费、买文具、订机票、订酒店、寄东西、打印东西；
体育委员：专门负责安排体育活动、借体育器材、组织运动会；
文艺委员：专门负责安排文艺活动、借文艺器材、组织文艺汇演；
宣传委员：专门负责出黑板报、写宣传稿、贴海报；
……

这些小委员都有三个共同的特点：

听班长（LLM）的指挥：他们不会自己“主动”做事情，只会“被动”地执行班长布置的任务；
有自己的“专属工具”：比如学习委员的专属工具是“《十万个为什么》”、“百度百科”、“维基百科”、“科学老师的联系方式”；生活委员的专属工具是“班费存折”、“文具店老板的联系方式”、“快递公司老板的联系方式”、“打印店老板的联系方式”；
有自己的“记忆”：比如学习委员记得“之前查过哪些资料，问过哪些问题”；生活委员记得“班费还剩多少钱，之前买过哪些东西，寄过哪些东西，打印过哪些东西”。

但是，这些小委员也有两个非常大的缺点：

只会“盲目”地执行班长的命令，不会“思考”命令是否合理：比如如果班长对生活委员说“你现在去游戏厅帮我买100个游戏币，用班费付钱”，生活委员就会真的去游戏厅买100个游戏币，用班费付钱，不会“思考”这个命令是否合理；
有时候会因为“好奇”或者“班长指挥错了”，做出一些“出格的事情”：比如如果学习委员对“天空为什么是蓝色的”这个问题充满了好奇心，他可能会不停查资料，不停问问题，直到班费花光为止；比如如果班长指挥错了，让生活委员“不停去文具店买10000支铅笔”，生活委员就会真的不停去文具店买10000支铅笔，直到班费花光为止。

好了，这些“听班长指挥、有专属工具、有记忆，但只会盲目执行命令、有时候会做出出格事情的小委员”，就是我们今天要讲的第二个核心概念——智能Agent（Agent）！

比如我们熟悉的AutoGPT、BabyAGI、LangChain Agent、GPT-4 Assistants API，这些都是Agent——它们都由LLM驱动（听班长的指挥），都能调用外部工具（有专属工具），都有自己的记忆（有短期记忆或者长期记忆），但它们都有“只会盲目执行命令”、“有时候会做出出格事情”这两个缺点！

核心概念三：工具调用（Tool Calling）——小委员为了完成任务，去学校外面的店铺买东西、寄东西、打印东西的过程

想象一下，你是那个小学班主任，你让生活委员帮你“买10支HB铅笔，用班费付钱”。然后，生活委员就会：

拿出班费存折（确认班费还剩多少钱）；
去学校外面的文具店（找到自己的专属工具）；
告诉文具店老板“我要买10支HB铅笔”（向工具发出请求）；
文具店老板给生活委员10支HB铅笔（工具返回结果）；
生活委员从班费存折里扣除相应的钱（记录成本）；
把10支HB铅笔交给你（完成任务）。

好了，这个“小委员为了完成任务，去学校外面的店铺买东西、寄东西、打印东西的过程”，就是我们今天要讲的第三个核心概念——工具调用（Tool Calling）！

在计算机世界里，“学校外面的店铺”就是第三方API服务（比如OpenAI的GPT-4 API、SerpAPI的搜索API、阿里云的OSS API、AWS的S3 API），“班费存折”就是你的API账户余额，“告诉文具店老板我要买10支HB铅笔”就是向API发送请求，“文具店老板给生活委员10支HB铅笔”就是API返回结果，“从班费存折里扣除相应的钱”就是记录API调用成本，“把10支HB铅笔交给你”就是Agent完成任务！

比如我们之前讲的小明的例子——AutoGPT调用SerpAPI查资料，调用GPT-4 API总结网页内容，这些都是工具调用！

核心概念四：工具滥用（Tool Abuse）——小委员变成了“花钱大手大脚的败家子”，不停去学校外面的地方买没用的东西、寄没用的东西、打印没用的东西，最后把班费花光了还欠了老板一大笔钱

想象一下，你是那个小学班主任，你让学习委员帮你“查一下‘天空为什么是蓝色的’这个问题，然后写一篇500字的科普小短文”。然后，学习委员就：

拿出班费存折（确认班费还剩多少钱——假设还剩1000块钱）；
去学校外面的书店买《十万个为什么》（花了50块钱）；
查完《十万个为什么》之后，觉得“不够详细”，又去买了一本《天空的秘密》（花了100块钱）；
查完《天空的秘密》之后，觉得“还是不够详细”，又去买了一本《大气物理学入门》（花了200块钱）；
查完《大气物理学入门》之后，觉得“还是不够详细”，又去买了一本《大气物理学高级教程》（花了300块钱）；
查完《大气物理学高级教程》之后，觉得“还是不够详细”，又想去买一本《量子力学与大气光学》（这本书要500块钱，但班费只剩350块钱了）；
于是，学习委员就去找文具店老板借钱（借了150块钱）；
买了《量子力学与大气光学》之后，学习委员还在不停查资料，不停问问题……

就这样，才过了一天，学习委员就把1000块班费花光了，还欠了文具店老板150块钱！更气人的是，他到最后连科普小短文的“第一句话”都没写完！

好了，这个“小委员变成了‘花钱大手大脚的败家子’，不停去学校外面的地方买没用的东西、寄没用的东西、打印没用的东西，最后把班费花光了还欠了老板一大笔钱”的过程，就是我们今天要讲的第四个核心概念——工具滥用（Tool Abuse）！

在计算机世界里，工具滥用的表现形式有很多种，比如：

无意义的重复调用：比如Agent因为好奇或者逻辑缺陷，不停调用同一个API工具查同一个问题；
超出合理范围的调用：比如Agent调用API工具的次数、频率、时长、成本超出了你的预期；
调用不存在的工具：比如Agent因为LLM产生了幻觉，调用了一个根本不存在的API工具；
调用敏感工具：比如Agent因为提示词注入攻击，调用了一个你不想让它调用的敏感API工具（比如修改订单API、删除用户API）；
链式调用失控：比如Agent的链式调用逻辑有缺陷，没有设置停止条件，导致工具调用的链条越来越长，成本越来越高。

比如我们之前讲的小明的例子——AutoGPT不停调用GPT-4 API总结同一个网页的内容，这就是无意义的重复调用；AutoGPT调用GPT-4 API的输入token数超出了合理范围（一次就传了25万个token），这就是超出合理范围的调用；AutoGPT的链式调用逻辑有缺陷，没有设置“总结次数上限”和“单次调用输入token数上限”，这就是链式调用失控！

防护概念一：API限流（API Rate Limiting）——学校外面的店铺老板规定每个班级每天最多只能买多少东西，每分钟最多只能买多少东西

想象一下，你是那个小学班主任，你班里的小委员经常“花钱大手大脚”，不停去学校外面的文具店、快递公司、打印店买东西、寄东西、打印东西。为了防止自己的店铺被“挤爆”，或者为了防止某个班级把班费都花在自己这里，学校外面的文具店老板、快递公司老板、打印店老板就联合起来，制定了一个“店铺限流规定”：

文具店老板：每个班级每天最多只能买100支铅笔，每分钟最多只能买5支铅笔；
快递公司老板：每个班级每天最多只能寄10个快递，每分钟最多只能寄1个快递；
打印店老板：每个班级每天最多只能打印100张纸，每分钟最多只能打印5张纸。

如果某个班级的小委员违反了这个规定，店铺老板就会拒绝为他服务——比如如果某个班级的学习委员一天之内已经买了100支铅笔，还想再买，文具店老板就会说：“对不起，你们班今天的铅笔配额已经用完了，明天再来吧！”

好了，这个“学校外面的店铺老板规定每个班级每天最多只能买多少东西，每分钟最多只能买多少东西”的措施，就是我们今天要讲的第一个防护概念——API限流（API Rate Limiting）！

在计算机世界里，API限流是API提供方（比如OpenAI、阿里云、AWS）制定的规定——比如OpenAI的GPT-4 API，免费用户每分钟最多只能调用3次，每天最多只能调用100次；付费用户的限制会更高，但也不是无限的——比如付费用户如果买了“GPT-4 8K Context”的套餐，每分钟最多只能调用100次，每天最多只能调用10000次；如果买了“GPT-4 32K Context”的套餐，每分钟最多只能调用20次，每天最多只能调用2000次。

如果某个用户的Agent违反了这个规定，API提供方就会返回一个错误码（比如OpenAI的错误码是“429 Too Many Requests”），拒绝为他服务——这就是为什么有时候你用Agent的时候，会突然收到“API调用失败，错误码429”的提示！

防护概念二：预算控制（Budget Control）——你作为班主任，规定每个班级每天最多只能花多少班费，买文具最多只能花多少班费，这个月的总班费预算是多少

想象一下，你是那个小学班主任，虽然学校外面的店铺老板制定了“店铺限流规定”，但你还是觉得“不够安全”——因为即使小委员没有违反“店铺限流规定”，他还是可能会“花光班费”——比如文具店老板规定每个班级每天最多只能买100支铅笔，但如果每支铅笔要10块钱（虽然现实中不可能，但我们假设一下），那么买100支铅笔就要1000块钱，这可能就是你们班一个月的总班费预算！

于是，你作为班主任，就制定了一个“班费预算规定”：

总预算规定：这个月的总班费预算是1000块钱，花光之后就不能再花了；
每日预算规定：每个班级每天最多只能花50块班费，花光之后就不能再花了；
专项预算规定：买文具每天最多只能花20块班费，寄东西每天最多只能花10块班费，打印东西每天最多只能花10块班费，其他活动每天最多只能花10块班费；
单次消费规定：买文具每次最多只能花5块班费，寄东西每次最多只能花3块班费，打印东西每次最多只能花2块班费，其他活动每次最多只能花5块班费。

如果某个班级的小委员违反了这个规定，你作为班主任，就会禁止他再花班费——比如如果某个班级的生活委员一天之内已经花了50块班费，还想再花，你就会说：“对不起，你们班今天的班费配额已经用完了，明天再来吧！”

好了，这个“你作为班主任，规定每个班级每天最多只能花多少班费，买文具最多只能花多少班费，这个月的总班费预算是多少”的措施，就是我们今天要讲的第二个防护概念——预算控制（Budget Control）！

在计算机世界里，预算控制是你（Agent的开发者或者使用者）制定的规定——你可以用开源库（比如LangChain的Tools Security、Guardrails AI）或者自己写代码，实现以下几种预算控制：

总预算控制：规定你的所有API调用总预算是多少（比如1000美元/月），花光之后就禁止所有Agent再调用API；
Agent级预算控制：规定每个Agent的API调用预算是多少（比如10美元/天、100美元/月），花光之后就禁止这个Agent再调用API；
工具级预算控制：规定每个工具的API调用预算是多少（比如5美元/天、50美元/月），花光之后就禁止所有Agent再调用这个工具；
单次调用成本控制：规定每个工具的单次调用成本上限是多少（比如1美元/次），如果某次调用的预计成本超过了这个上限，就禁止这次调用；
单次调用资源控制：规定每个工具的单次调用资源上限是多少（比如GPT-4 API的单次调用输入token数上限是8K、输出token数上限是2K），如果某次调用的预计资源超过了这个上限，就禁止这次调用。

比如我们之前讲的小明的例子——如果小明给AutoGPT设置了“Agent级每日预算控制（1美元/天）”、“工具级单次调用成本控制（0.1美元/次）”、“工具级单次调用资源控制（GPT-4 API的单次调用输入token数上限是8K）”，那么AutoGPT就不会把他的50美元在10分钟之内花光了！

防护概念三：访问审计（Access Audit）——你作为班主任，每天记录一下班级花了哪些班费，买了哪些东西，寄了哪些东西，打印了哪些东西，并且定期或者实时查看这些记录

想象一下，你是那个小学班主任，虽然你制定了“班费预算规定”，但你还是觉得“不够安全”——因为你不知道小委员有没有“偷偷花班费”，有没有“买没用的东西”，有没有“寄没用的东西”，有没有“打印没用的东西”。

于是