少样本学习 + 思维链 (CoT) + 数学应用题万能 Prompt

少样本学习 + 思维链 (CoT) + 数学应用题万能 Promptp AI Agent 的核心基础能力 少样本学习和思维链 CoT p 一句话 给大模型看 2 5 个 问题 正确答案 的例子 它就能学会做同类任务 对比 零样本 Zero Shot

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 

AI Agent的核心基础能力:少样本学习和思维链(CoT)

一句话:给大模型看 2-5 个 "问题 + 正确答案" 的例子,它就能学会做同类任务

对比:

  • 零样本 (Zero-Shot):不给任何例子,直接让 AI 做 → 效果最差,容易出错
  • 少样本 (Few-Shot):给 2-5 个例子 → 效果提升 50% 以上
  • 微调 (Fine-Tuning):用大量数据训练模型 → 效果最好,但成本高

大模型在预训练阶段已经见过了海量的文本,它已经学会了 "模仿"。你给它几个例子,它就能模仿例子的格式和逻辑,解决新的问题。

plaintext

 请帮我做情感分类: 例子1:今天天气真好 → 正面 例子2:这个电影太烂了 → 负面 例子3:我今天很开心 → 正面 问题:这家餐厅的菜很难吃 → ? 

AI 会自动模仿例子,输出 "负面"。

大模型的本质是逐字预测下一个词。如果你直接让它出答案:

 问题:3个苹果5块钱,12个苹果多少钱? AI:20块 ✅

简单题能对,但稍微复杂一点:

 问题:一个水池,单开甲管3小时注满,单开乙管6小时注满。两管同时开,几小时注满? AI:9小时 ❌

它直接跳步猜答案,根本没有 "思考" 过程。

让大模型把 "思考过程" 写出来,而不是直接出答案

就像我们做数学题一样:

  1. 先读题,找出已知条件
  2. 分析数量关系
  3. 一步步列式计算
  4. 检查结果

大模型也是一样,当它把中间步骤写出来时,它就能在生成的过程中纠正自己的错误,最终得到正确的答案

只需要在问题最后加一句话:

让我们一步步思考

效果立竿见影!

 问题:一个水池,单开甲管3小时注满,单开乙管6小时注满。两管同时开,几小时注满? 让我们一步步思考。

AI 会自动写出解题步骤,然后得出正确答案 "2 小时"。

给大模型看几个带完整解题步骤的例子,它会模仿这个步骤来解决新问题。这是目前解决复杂推理问题的**方法。

我给你两个版本:

  1. 基础版(零样本 CoT):简单题用
  2. 进阶版(少样本 CoT):复杂题用,正确率 90%+
 你是一位经验丰富的小学数学老师,擅长用清晰、简单的步骤讲解数学题。 请你解决下面的数学应用题,要求: 1. 先写出已知条件 2. 再分析解题思路 3. 一步步列式计算,不要跳步 4. 最后写出答案和单位 5. 检查计算是否正确 问题:{在这里写你的数学题} 让我们一步步思考。

给 AI 看 3 个带完整步骤的例子,它会严格模仿这个格式解题,正确率极高。

 你是一位专业的数学解题专家,擅长解决中小学数学应用题。 请严格按照下面的格式和步骤解决问题,不要跳步,不要省略任何计算过程。 --- 例子1 --- 问题:鸡兔同笼,头共35个,脚共94只,问鸡和兔各有多少只? 解题步骤: 1. 已知条件: - 总头数:35个 - 总脚数:94只 - 鸡有2只脚,兔有4只脚 2. 解题思路:假设全是鸡,计算总脚数,再和实际脚数比较,求出兔的数量 3. 计算: - 假设全是鸡,总脚数:35 × 2 = 70只 - 比实际少:94 - 70 = 24只 - 每只兔比鸡多:4 - 2 = 2只 - 兔的数量:24 ÷ 2 = 12只 - 鸡的数量:35 - 12 = 23只 4. 检查:23×2 + 12×4 = 46 + 48 = 94只,正确 答案:鸡23只,兔12只 --- 例子2 --- 问题:小明从家到学校,每分钟走60米,10分钟可以到达。如果每分钟走50米,需要几分钟到达? 解题步骤: 1. 已知条件: - 速度1:60米/分钟 - 时间1:10分钟 - 速度2:50米/分钟 2. 解题思路:先求出总路程,再用总路程除以速度2得到时间2 3. 计算: - 总路程:60 × 10 = 600米 - 时间2:600 ÷ 50 = 12分钟 4. 检查:50×12 = 600米,正确 答案:需要12分钟 --- 例子3 --- 问题:一项工程,甲单独做需要10天完成,乙单独做需要15天完成。两人合作,需要几天完成? 解题步骤: 1. 已知条件: - 甲的工作效率:1/10 每天 - 乙的工作效率:1/15 每天 2. 解题思路:先求出两人合作的工作效率,再用总工作量1除以合作效率 3. 计算: - 合作效率:1/10 + 1/15 = 3/30 + 2/30 = 5/30 = 1/6 每天 - 合作时间:1 ÷ (1/6) = 6天 4. 检查:6×(1/10 + 1/15) = 6×(1/6) = 1,正确 答案:需要6天 --- 现在解决下面的问题 --- 问题:{在这里写你的数学题} 解题步骤:

把下面的代码复制到你的项目里,替换成你的数学题就能测试效果。

python

运行

 import os from dotenv import load_dotenv from openai import OpenAI load_dotenv() client = OpenAI( api_key=os.getenv("DOUBAO_API_KEY"), base_url="https://ark.cn-beijing.volces.com/api/v3" ) def solve_math_problem(problem): prompt = f""" 你是一位专业的数学解题专家,擅长解决中小学数学应用题。 请严格按照下面的格式和步骤解决问题,不要跳步,不要省略任何计算过程。 --- 例子1 --- 问题:鸡兔同笼,头共35个,脚共94只,问鸡和兔各有多少只? 解题步骤: 1. 已知条件: - 总头数:35个 - 总脚数:94只 - 鸡有2只脚,兔有4只脚 2. 解题思路:假设全是鸡,计算总脚数,再和实际脚数比较,求出兔的数量 3. 计算: - 假设全是鸡,总脚数:35 × 2 = 70只 - 比实际少:94 - 70 = 24只 - 每只兔比鸡多:4 - 2 = 2只 - 兔的数量:24 ÷ 2 = 12只 - 鸡的数量:35 - 12 = 23只 4. 检查:23×2 + 12×4 = 46 + 48 = 94只,正确 答案:鸡23只,兔12只 --- 例子2 --- 问题:小明从家到学校,每分钟走60米,10分钟可以到达。如果每分钟走50米,需要几分钟到达? 解题步骤: 1. 已知条件: - 速度1:60米/分钟 - 时间1:10分钟 - 速度2:50米/分钟 2. 解题思路:先求出总路程,再用总路程除以速度2得到时间2 3. 计算: - 总路程:60 × 10 = 600米 - 时间2:600 ÷ 50 = 12分钟 4. 检查:50×12 = 600米,正确 答案:需要12分钟 --- 现在解决下面的问题 --- 问题:{problem} 解题步骤: """ response = client.chat.completions.create( model="doubao-pro-32k", messages=[{"role": "user", "content": prompt}], temperature=0.1 # 数学题用最低的温度,保证准确性 ) return response.choices[0].message.content # 测试 if __name__ == "__main__": problem = "一个商店运来苹果和梨共180千克,苹果的重量是梨的3倍。苹果和梨各有多少千克?" result = solve_math_problem(problem) print(result)

执行结果:

 1. 已知条件: - 苹果和梨总重量:180千克 - 苹果的重量是梨的3倍 2. 解题思路:设梨的重量为x千克,则苹果的重量为3x千克。根据题目给出的信息,可以建立方程来表示两者之间的关系,并解出x的值。 3. 计算: - 设梨的重量为x千克,则苹果的重量为3x千克。 - 根据题目信息,我们有等式 x + 3x = 180 - 合并同类项得到 4x = 180 - 解得 x = 180 ÷ 4 = 45千克(这是梨的重量) - 因此,苹果的重量为 3 × 45 = 135千克 4. 检查:45 + 135 = 180千克,符合题目给定的总重量。 答案:梨45千克,苹果135千克。

  1. 降低 temperature:数学题用 temperature=0.1,越接近 0 越严谨
  2. 要求检查:在 Prompt 里加上 “最后一定要检查计算是否正确”
  3. 要求用不同方法验证:“请用两种不同的方法解题,验证答案是否一致”
  4. 拆分复杂问题:如果问题特别长,先让 AI“把这个问题拆成几个小问题”,再逐个解决

小讯
上一篇 2026-04-27 17:18
下一篇 2026-04-27 17:16

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/279438.html