2026年langchain 快速入门(三)：搭建RAG知识库

科技前沿 • 2026-04-02 11:03 • 阅读 0

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

LLM大模型一般训练的数据都是滞后的，这是就需要用到RAG知识库，RAG知识库可以降低大模型在输出答案时的幻觉，也能够让大模型知识拓展。

将每个切片文字块转换为关系向量

关系向量是怎么来的？ 这些是通过对模型进行大量的上下文训练，得到的词语与词语，句子与句子的语义关系上的关联，这是LLM的基础。
不同的文字向量模型输出的向量矩阵也会不同，因此在构建和检索时需要用同一个文字向量模型进行转换。

用文本也能搜索，为什么要用向量呢？ 文本的数据库检索一般通过正则搜索，这种无法关联语义进行检索，因为我们无法保证大模型在检索时能够按照固定的格式。举个例子：

本次都利用千问的语言模型，和FAISS向量数据库演示，来演示

代码的流程如下：

这里利用了langchain提供的文本分词器（递归分词）

这部分要注意：新版FAISS读取现有数据库要设置：allow_dangerous_deserialization=True，不然会报错

之前没有讲到历史对话记录，这次补充下：

这个是langchain框架的占位符（其实是框架写好了prompt模板，告诉ai这个是历史对话），使用时将历史对话记录的数组放在这里设置的字段中，在添加历史对话时要使用相关的类进行声明对话（告诉ai这句话是ai说的还是用户说的）

Chain链流程：

是获取上一个任务传递过来的字段内容。

如果❤喜欢❤本系列教程，就点个关注吧，后续不定期更新~