本地搭建LLM知识库指南(极其详细),从入门到精通,收藏这一篇就够了!

本地搭建LLM知识库指南(极其详细),从入门到精通,收藏这一篇就够了!svg xmlns http www w3 org 2000 svg style display none svg

大家好,我是讯享网,很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。



 
  
    
     
      
     

Andrej Karpathy 前不久在 X 上分享了他用 LLM 构建个人知识库的工作流:数据摄取(raw/ 目录)→ LLM 编译为 wiki → Q&A → 输出 → linting,形成自我增强的知识库闭环。核心观点是:当 wiki 足够大(~100 篇、40 万词)时,直接向 LLM Agent 提问,其效果不亚于复杂的 RAG 方案,且整个 wiki 由 LLM 维护,人类很少直接编辑。

大家都知道,最快出东西的是Graphify,我在ClaudeCode和OpenClaw上尝试的用了用,还是蛮丝滑的,准备集成到项目和产品中去

不过就咱们手头现有的东西,其实也能很好的“攒”一个版本出来,并且还更通用,尤其是对不是搞技术的小伙伴们。本人通过摸索,基于 Karpathy 的方法,通过如下工具栈:浏览器Obsidian插件 + Obsidian + Claudian(将 Claude Code 集成进 Obsidian 的插件),在本地完整实现一个类似的知识库。全程本地运行,数据完全自主可控。这里跟小伙伴们分享一下!


1. 安装 Obsidian 并创建 Vault

下载并安装 Obsidian[1],启动后新建一个 Vault,建议命名为 MyKnowledgeBase

MyKnowledgeBase/ 

2. 安装浏览器插件 Obsidian Web Clipper

在浏览器中安装 Obsidian Web Clipper[2] 扩展(支持 Chrome、Firefox 等主流浏览器)。安装后在浏览器工具栏找到插件图标,点击设置授权访问你的 Vault 地址。

3. 通过浏览器收藏感兴趣的文章

以后在浏览器中浏览到任何值得留存的文章,点击 Obsidian Web Clipper 图标,选择保存路径,将其存入 Vault 的 /Clippings 目录:

MyKnowledgeBase/└── Clippings/ └── {文章标题}.md 

Web Clipper 会自动将网页正文提取为 Markdown,并下载文章中的图片到本地。

4. 安装 Claude Code 并配置大模型

本地安装 Claude Code CLI:

# macOS/Linuxbrew install anthropic/cli/claude# 或通过 npmnpm install -g @anthropic-ai/claude-code 

安装后运行 claude auth 完成认证配置。关于模型提供者的选择,Claude Code 默认使用 Anthropic API,也可以配置 OpenRouter、Kimi 等兼容接口。

5. 安装并配置 Claudian 插件

Claudian[3] 是一个将 AI 编程助手(Claude Code、Codex 等)嵌入 Obsidian 的插件,Vault 本身成为 Agent 的工作目录,文件读写、搜索、bash、多步工作流开箱即用。目前 GitHub ⭐ 6.9k。

安装方式(推荐 BRAT):

  1. 在 Obsidian 中安装 BRAT 插件(Obsidian Community Plugins 搜索 “BRAT”)
  2. 启用 BRAT 后,打开 BRAT 设置 → 点击 “Add Beta plugin”
  3. 输入:https://github.com/YishenTu/claudian
  4. 点击 “Add Plugin”,BRAT 会自动安装并持续更新 Claudian
  5. 在 Settings → Community plugins 中启用 “Claudian”

另一种方式(手动安装):

  1. 从 最新 Release[4] 下载 main.jsmanifest.jsonstyles.css
  2. 在 Vault 中创建目录 .obsidian/plugins/claudian/,将文件放入
  3. 在 Obsidian 中启用插件

测试 Claudian 是否正常工作:

  1. 在 Obsidian 侧边栏打开 Claudian 聊天窗口(点击功能区 ribbon 图标或用命令面板搜索 “Claudian”)
  2. 在输入框中输入:
    在当前 Obsidian 的 vault 下创建一个新的 md 文件,内容写入 "Hello guys, Claudian is now working." 

  3. Claudian 会调用 Claude Code,在 Vault 中创建文件并写入内容,说明集成成功

故障排除:如果遇到 “Claude CLI not found”,在 Obsidian Settings → Claudian → Advanced → Claude CLI path 中手动填入 claude 的路径(macOS/Linux 下运行 which claude 查看路径)。

6. 创建目录结构并初始化 CLAUDE.md(关键)

在 Vault 根目录创建以下结构:

MyKnowledgeBase/├── CLAUDE.md├── Clippings/ # 原始剪藏(由 Web Clipper 填充)├── wiki/│ ├── INDEX.md # 知识库入口(稍后由 AI 初始化)│ └── articles/ # AI 生成的摘要文章└── outputs/ # 查询结果存放 

创建 CLAUDE.md,写入知识库规则:

# Knowledge Base Schema 快速开始 首先打开:[[wiki/INDEX.md]] 三种使用方式1. 浏览知识:打开 INDEX.md → 选择主题 → 阅读文章2. 搜索知识:向 AI 提问 → AI 读取 INDEX.md 理解结构 → 综合回答存入 outputs/3. 添加新内容:保存到 Clippings/ → AI 编译到 wiki/articles/ → INDEX.md 自动更新 文件结构vault/├── Clippings/ # 原始数据├── wiki/│ ├── INDEX.md # 知识库入口│ └── articles/ # AI 摘要文章└── outputs/ # 查询结果 核心规则- 优先使用 wiki,不需要复杂 RAG- 从 [[wiki/INDEX.md]] 开始- 将新内容添加到 Clippings/- 手动编辑 wiki/articles/ 中的文章(由 AI 编译产生) 

7. 通过Claudian初始化wiki/INDEX.md

在 Claudian 窗口输入指令,让 AI 根据 CLAUDE.md 的描述初始化 wiki/INDEX.md

请根据 CLAUDE.md 的描述,在 wiki/ 目录下初始化 INDEX.md,内容包含:1. WIKI 知识库导航(顶部描述)2. 快速导航(按主题浏览、快速链接、提出问题)3. 知识库规模(当前为 0 篇)4. 按主题浏览(占位结构,主题为:开发工具、大模型、智能体、世界模型) 

AI 会生成一个符合 CLAUDE.md 规范的 wiki/INDEX.md 初始内容。

8. 日常使用:当有新内容加入 Clippings 时

这是整个工作流的核心闭环。在 Claudian 中输入:

请检查 Clippings/ 目录下是否有新的文章。如果有,请为每篇新文章生成摘要(包含 frontmatter:title、source、created、description、tags、references),保存到 wiki/articles/ 目录,文件名用中文命名。然后更新 wiki/INDEX.md 中的「知识库规模」和「按主题浏览」部分。 

AI 会:

  1. 读取 Clippings/ 中的新文章
  2. 生成带 references 字段的摘要,写入 wiki/articles/
  3. 更新 wiki/INDEX.md 的规模和目录结构

9. 知识查询&使用知识库内容创作

在 Claudian 窗口直接提问:

我想了解 Code-as-Policy 是什么,请从 wiki/INDEX.md 开始搜索相关文章并给我一个综合回答。 

AI 会优先读取 INDEX.md 理解知识库结构,再搜索相关文章,给出综合答案。


本文介绍了如何利用 Obsidian + Claudian 在本地完整复现 Karpathy 的 LLM 知识库工作流:Web Clipper 收集资料 → AI 编译为 wiki 摘要 → 直接对话知识库 → 输出结果回流进 wiki。整个过程数据完全本地存储,LLM 全程主导知识库的维护和查询,人类的角色从「内容编辑者」转变为「知识提出者」。

🤔2026年AI风口已来!各行各业的AI渗透肉眼可见,超多公司要么转型做AI相关产品,要么高薪挖AI技术人才,机遇直接摆在眼前!

有往AI方向发展,或者本身有后端编程基础的朋友,直接冲AI大模型应用开发转岗超合适!

就算暂时不打算转岗,了解大模型、RAG、Prompt、Agent这些热门概念,能上手做简单项目,也绝对是求职加分王🔋

在这里插入图片描述

📝给大家整理了超全最新的AI大模型应用开发学习清单和资料,手把手帮你快速入门!👇👇

学习路线:

以上6大模块,看似清晰好上手,实则每个部分都有扎实的核心内容需要吃透!

我把大模型的学习全流程已经整理📚好了!抓住AI时代风口,轻松解锁职业新可能,希望大家都能把握机遇,实现薪资/职业跃迁~

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

小讯
上一篇 2026-04-15 08:53
下一篇 2026-04-15 08:51

相关推荐

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/258102.html