2026年Agents(智能代理)- LangChain 六大组件之六

Agents(智能代理)- LangChain 六大组件之六简单的来讲就是在模型最推理过程中的 self attention 时 缓存下 k v 的矩阵 然后每次新的 token 进来只需要在这个缓存的矩阵上拼接更新就行 避免了许多重复的计算 加快了推理的过程 该微调方式是对不同的任务加上对应的虚拟 token 然后在大模型的 embedding 层中加入这些虚拟 token 的向量 在真正进行训练过程中只更新这些 token 对应的 embedding 层向量

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

简单的来讲就是在模型最推理过程中的self-attention时,缓存下k*v的矩阵,然后每次新的token进来只需要在这个缓存的矩阵上拼接更新就行,避免了许多重复的计算,加快了推理的过程。:该微调方式是对不同的任务加上对应的虚拟token,然后在大模型的embedding层中加入这些虚拟token的向量,在真正进行训练过程中只更新这些token对应的embedding层向量。:在大模型的前面加上一个小网络层结构(小模型),训练时让数据先过这个小模型,在过这个大模型,最终权重的更新只更新前面那个小模型。

小讯
上一篇 2026-03-16 20:26
下一篇 2026-03-16 20:24

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/238655.html