近期,各类AI工具的爆火,引起不少小伙伴们的兴趣。很多人想用AI帮助自己处理、分析生活中的一些文件、数据等等。但如果用网页版、APP版,每次上传文件会很麻烦!所以建立一个个人知识库,会方便很多。
建立个人知识库用于AI训练,其实很简单!网上也有很多说法,说这样那样的,众说纷纭!但,我保证,看完今天这篇推文,你自己也可以轻松建立知识库!
本期教程有两个方法 建立个人知识库,全程零代码!全程图形化操作,小白可直接按照步骤上手,而且不容易出错!
方法一:建立云端个人知识库
方法二:建立本地个人知识库
无需任何编程基础,也不需要输入任何代码,全程图形化界面! 支持PDF、Excel、TXT等格式文件建立知识库!
操作步骤
注册与登录,访问阿里百炼平台官网,使用阿里云账号登录。
https://bailian.console.aliyun.com/

创建智能体应用。点击「我的应用」→「新增应用」。

根据你的应用场景不同,可以选择不同的模式,这里我就直接演示创建智能体应用。

点击「直接创建」

在左上角的【模型选择】中,选择你需要的AI大模型。可以选择的大模型有很多,按照你的喜好选就OK!

我直接选了【通义千问-MAX】,点击确定

然后回到我们的百炼平台空间界面

接下进行我们的个人知识库构建
知识库构建
数据上传:在「数据管理」页面,点击导入数据,上传我们的文件(单文件建议<50MB),支持批量拖拽。


上传完成,点击确定后,阿里云会自动帮我们进行文件解析。

索引建立:点击「知识索引」→「创建知识库」。

然后,命名你的知识库名称与描述信息

接着,选择我们上一步上传的文件,小嘟我在这里,上传了一些APP宝箱公众号的文章(PDF格式)。

点击下一步,默认数据处理为智能切分即可

系统自动完成向量化处理(约5-10分钟)。

数据向量化处理(类比理解:想象你整理实体书时,给每本书贴上包含「主题色块」(红色=科技、蓝色=历史)+「关键词坐标」的标签。这样找书时不用翻开每本书,看一眼标签就能快速锁定目标区域——向量化就是给数据贴这样的智能标签。)
接着就可以开始调用我们的知识库了!
完成上面的步骤后,回到空间主界面,点击「我的应用」,选择我们之前创建好的智能体应用。并打开左下角的【知识库检索增强】

然后点击【配置知识库】,选择【添加】知识库

开始测试
在右侧对话窗口提问“APP宝箱公众号是啥?”
导入个人知识库前,无法得到有效结果:

导入我们的个人知识库后,回答精确

关于对话参数调整:根据反馈,可调节「温度系数」(0.3-0.7控制答案严谨性)、「上下文轮数」(建议3-5轮)。
注意事项:
文件格式限制:如果是拍照扫描版的PDF文件,需先用OCR工具(如WPS)转换为可编辑文本,再上传!
02
方法二:建立本地个人知识库
该方法,知识库搭建在个人电脑本地,不上传云端服务器!
一、工具准备
公众号后台获取,或者官网下载核心工具安装包:Cherry Studio(免费开源,支持中文)
官网下载地址:https://cherry-ai.com/download

安装说明:双击.exe文件安装包,选择默认路径(如C:Program FilesCherryStudio),全程点击“下一步”即可。

注册API密钥(用于连接AI大脑)
访问硅基流动平台,点击“免费注册”
https://cloud.siliconflow.cn/i/dqGFQGxJ

点击左边的「API密钥」,选择右上角的「新建API密钥」,

创建完成后,点击密钥(形式如sk-xxxxxx),就会自动复制。

二、软件配置
创建好了API 密钥,我们接下来就该配置AI模型了。
打开CherryStudio软件,点击左下角的【设置】图标,在模型服务中选择「硅基流动」。

粘贴我们复制的API密钥到对应输入框,点击旁边「检查」按钮,会提示“连接成功”。

构建本地个人知识库
选择配置嵌入模型(嵌入模型可以把我们上传的文档,首下分块,使用嵌入模型转换成AI 可以识别的向量内容,最后存入向量数据库。)
在【设置】——【模型服务】中选择【硅基流动],点击【管理】,选择【嵌入】。

我们选择第一个【bge-m3】,它对于中文数据处理的表现非常出色,支持多语言混合,长文本支持,最大支持8192 token。

一般我们选择硅基流动模型服务,它的默认嵌入模型就是bge-m3。
上述步骤完成后,接下来我们建立本地个人知识库。点击左边的【知识库】图标,选择【添加】。

命名你的知识库名称,嵌入模型我们选择【BAAI/bge-m3】

然后,上传我们的知识库文件(这里为了与前面阿里云知识库演示一致,小嘟我上传了公众号pdf版文章)。上传的资料类型,它不仅支持各种文件,目录;也可以一键抓取网址,网站内容;还可以添加你的笔记。

以上步骤全部完成后,就可以开始使用啦!
我们来到聊天页面,在底部知识库选择已经添加的知识库(我的知识库名称是“APP宝箱”)

开始测试
在未选择个人知识库前,询问“APP宝箱公众号是什么?”
得到结果比较含糊广泛(如下图所示)

(选择知识库前)
选择知识库后,回答精确,并引用来源

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/224848.html