最强Claude比黄金还贵，有人用省token.skill 立降65%，还有10个小妙招

科技前沿 • 2026-04-10 15:15 • 阅读 0

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

AI模型越来越强大，成本也水涨船高。面对日益昂贵的Token消耗，文章探讨了从利用特定技能到优化使用习惯等一系列实用策略，旨在帮助用户实现降本增效，核心在于“少即是多”。

1. Token危机：最强大的AI也是最昂贵的

Anthropic发布的最新模型Claude Mythos不仅是史上最强，也是史上最贵，其API价格高达每百万Token输入25美元/输出125美元，比Claude Sonnet贵了近8倍。即便使用普通Agent，一句简单的“你好”也可能消耗掉月度Token额度的13%，使得与AI“说不起话”成为现实问题。

2. 无效尝试：文言文省Token是个伪命题

有网友提出用文言文与AI聊天以节省Token，但测试表明这并不可行。大语言模型的Token划分基于语义而非字符长度，例如“无恙”会被编码成3个Token，而一串8字符的常用短语可能只占1个Token，因此压缩字符数并不能有效减少Token消耗。

3. 有效方案：Caveman技能立降65% Token

GitHub上走红的caveman项目通过强制角色设定，要求模型停止使用客套话、去除冠词和模糊词汇，实现在多项基准任务中节省约65%的输出Token，且保证100%准确率。该项目还提供压缩脚本，能将项目记忆文件重写为“山顶洞人语”，使输入Token减少约45%。

4. 科学依据：简洁约束反而提升模型性能

研究论文《Brevity Constraints Reverse Performance Hierarchies in Language Models》指出，强制模型给出简短回复不仅节省Token，更使其在某些任务上的准确率提升了26个百分点。Zoom的论文《Chain of Draft》提出的“草稿思维链”（CoD）方法，要求每个推理步骤不超过5个词，在保持准确性的同时，Token消耗最低可降至传统思维链的7.6%。

5. 十大诀窍：从使用习惯上高效管理Token

编辑而非新增：修改原消息而非发送新消息，避免AI重读全部历史记录。
定期开启新对话：每15-20条消息后让AI总结进度，然后开启新对话，避免长对话的无底洞消耗。
合并问题：将多个相关请求合并到一条消息中发送，减少上下文加载次数。
利用Projects缓存：将常用文件上传至Projects，避免重复上传消耗Token。
预设记忆与偏好：在设置中保存职业、风格等偏好，省去每次重复交代背景的Token。
关闭非必要功能：如非必需，关闭联网搜索、高级思考等常开即耗Token的功能。
模型分工：简单任务用低成本模型（如Haiku），复杂任务再用高性能模型。
分散使用时段：基于“滚动5小时”的限额，将工作分散到全天不同时段。
避开高峰：在非高峰期（如晚上或周末）使用，同样的请求消耗的限额更少。
开启超额使用：付费用户可设定预算上限，额度耗尽时自动按量计费，避免工作中断。