3月底,前OpenAI 联合创始人 Andrej Karpathy 在 X 上发了两条长推,讲他如何用 LLM 构建个人知识库。两条推文加起来获得超过 46,000 个赞、1300 万次浏览[1][2]。这不是普通的"好物推荐"——Karpathy 可能是全球最顶尖的 AI 工程师之一,他的个人工具箱往往代表着一种新的工程范式。
这一次,他的方法出奇地简单:不依赖向量数据库,不搭建 RAG 架构,直接让 LLM 读写 Markdown 文件。
每个和 AI 对话超过半小时的人,都会有一种熟悉的失落感:上下文窗口关掉之后,AI 就什么都不记得了。你花 20 分钟解释你的项目背景、AI 给了一堆建议,下次打开对话框,一切从零开始。
传统的解法是 RAG(检索增强生成)——把文档切成块、向量化、存进向量数据库,查询时做相似度匹配。这套方案在企业场景下很成熟,但对独立创作者来说:需要配置分块策略、调 embedding 模型、管理向量数据库,门槛不低。
Karpathy 的发现则反直觉:对于个人知识库规模(他的某个研究主题约 100 篇文章、40 万词),直接让 LLM 读取它自己维护的摘要文件,效果不比向量检索差,但简单得多[1][3]。这意味着,你可以用一套纯文本 + LLM方案,实现过去需要一整套基础设施才能做到的事情。
Karpathy 把他的整个工作流叫做"编译":把散乱的原材料,加工成有结构的知识体系[1][3]。
第一步是数据摄入。所有原始资料——论文、网页文章、GitHub 仓库、甚至图片——全部扔进一个 raw/ 文件夹。他使用 Obsidian Web Clipper 插件,可以一键把网页转成 Markdown 并保存图片到本地,确保 AI 能通过 vision 能力看到图片。
第二步是LLM 自动编译。这是整个系统的核心创新点:不是简单索引文件,而是让 LLM 主动撰写结构化的 Wiki——为每篇文档生成摘要,建立双向链接(相关概念互相引用),撰写百科风格的概念文章,把相关资料串联起来。Karpathy 的比喻是"像编译代码一样编译知识"[1][3]。
第三步是直接问答。当知识库积累到一定规模,他不再使用关键词搜索,而是直接用自然语言向 LLM 提问。LLM 读取它自己维护的索引和摘要文件,直接回答。
第四步是定期维护(Linting)[4]。Karpathy 让 LLM 定期对知识库做"体检":找出不一致的地方,补充缺失的信息,建议新的研究方向。这借鉴了代码质量检查的概念——让知识库像代码一样,保持健康和一致。
在 Karpathy 的方案里,Obsidian 扮演的不是一个普通笔记工具的角色,而是整个系统的前端 IDE[1][6]。
这里有一个值得深入的结构洞:Obsidian 的双向链接,本质上是一种空间化的知识导航。当你在 A 笔记里引用 B 笔记,Obsidian 会在 B 笔记里自动生成反向链接——这种"我指向你,你也指向我"的关系,在建筑学里有个类似的概念叫空间渗透,即不同空间彼此开放、互相可见。Obsidian 把这个概念移植到了知识管理中:每一个知识点都不孤立,而是处在一张互相可达的网络里[6][7]。
更深一层的设计是三层分离:原始数据放在 raw/,整理后的 wiki 放在 wiki/,衍生可视化放在独立视图。LLM 负责撰写和维护几乎所有 wiki 内容,人类很少直接编辑[1][3]。这意味着工具的主人从人类变成了 AI,而人类变成了审核者和使用者——一种有趣的人机关系倒置。
这套工作流对于一人公司形态的独立创作者有特殊意义。
传统公司有知识管理部、有 Confluence、有 Notion 空间、有团队协作来沉淀组织知识。但一个人作战的超级个体,没有团队分工,知识随项目结束就散落。Karpathy 的 raw → wiki → Q&A → 沉淀 循环,某种意义上是为个人设计的知识复利引擎[4][5]:每次使用知识库,都在为下一次积累——AI 帮你整理,人类负责判断。
这也呼应了 Karpathy 在 Farzapedia 推文里的一句判断:"Agent 熟练使用是 21 世纪的核心技能"[2]。这里的核心洞察是:不是你要去学 AI,而是你要学会用 AI 来构建你的数字认知伙伴——它帮你记忆、帮你整理、帮你发现你没注意到的关联。
如果你想尝试这套方法,最小的启动入口是什么?
答案是:现在就建一个 raw/ 文件夹,装上 Obsidian,打开 Web Clipper,开始把你觉得有用的网页一键存成 .md 文件。不要追求完美的分类体系,不要急着让 AI 整理——先让原材料流动起来。
从信息碎片到结构化知识,中间的桥梁是「收集 + 定期整理」。Karpathy 的工作流本质上是一套让 AI 帮你完成整理环节的自动化方案,而你要做的是给它足够多的原材料,以及偶尔的"健康检查"指令。
致最先触达未来的那一小部分人:基于Agent的第二大脑早日成型。
[1] Karpathy (X). LLM Knowledge Bases.
[2] Karpathy (X). Farzapedia.
[3] Karpathy. LLM Wiki Gist.
[4] VentureBeat. Karpathy shares LLM knowledge base architecture that reinvents personal wikis.
[5] Antigravity Codes. Karpathy‘s LLM Knowledge Bases: Full Breakdown.
[6] Eric J. Ma. Mastering Personal Knowledge Management with Obsidian and AI.
[7] Obsidian Help Documentation.
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/256971.html