YC总裁开源了他在用的AI记忆系统：10000个文件里找东西，再也不用grep了

科技前沿 • 2026-04-13 20:07 • 阅读 1

大家好，我是讯享网，很高兴认识大家。这里提供最前沿的Ai技术和互联网信息。

Garry Tan是谁不用多介绍了，YC现任总裁，硅谷最有话语权的早期投资人之一。他之前开源过一个叫gstack的工具包，已经炸过一波朋友圈，那东西说白了就是一整套产品开发的superpowers，从需求分析到上线全覆盖。

这次他又放了个更大的招 GBrain，一个个人AI记忆系统。

很多人在用AI Agent的时候都会碰到同一个坎：你给它喂了大量个人笔记、会议记录、日程安排，指望它能像个贴身秘书一样随时调取信息。但当你真的问它”上个月和OpenAI那次会议聊了什么”的时候，它大概率答不上来。

Garry Tan的数据量能说明问题：13年的日历数据，21000多个事件，5800条苹果笔记，280多条会议记录，300多条原创想法。这些全部存成Markdown文件，加起来一万多个。

一万多个文件，用grep搜一下试试？3000个文件以内还勉强能撑，过了这个线，响应时间直接从几毫秒飙到30秒以上。而且grep只能做关键词匹配，你问”找一些反常识的创业建议”，它完全没辙，因为这里面没有”反常识”三个字。

语义搜索和精确检索必须同时有，缺一个都不行。

GBrain的思路其实不复杂，但很实用。

搜索层用了两套引擎混着来。 一套是Postgres的tsvector做关键词检索，专门对付"找Pedro Franceschi的邮箱"这种精确查找。另一套是pgvector做向量搜索，负责语义匹配，"找关于反常识创业的建议"这种模糊查询就靠它。两路结果通过RRF算法融合排序，最后输出一个综合排名。

这个架构的好处是你不用二选一，精确的归精确，模糊的归模糊，各干各的活。

知识管理这块有个设计挺有意思，叫"编译事实+时间线"。 每个知识条目的顶部是动态更新的核心结论，随时可以改。底部是原始证据链，永远不动。这就像写论文，摘要可以反复改，但引用的文献和数据不能变。这样做的好处是AI在调取记忆的时候，既能拿到最新的结论，又能追溯原始出处。

还有一个我觉得很酷的功能，叫"夜间梦境循环"。 AI Agent在你不用它的时候（也就是"睡觉"的时候），会自动分析当天的对话记录，把断掉的引用链接修好，把碎片化的记忆合并到一起。说白了就是你不干活的时候，它在后台帮你整理笔记。

整个系统跑起来其实就是三步：

第一步，实体检测。 每条消息进来，自动识别里面提到的人、公司、概念。你聊了一句”昨天和李明聊了Q3的OKR”，系统就知道这里有两个实体：李明（人）、OKR（概念）。

第二步，三层查询。 先查GBrain里的世界知识，再查Agent自身的操作记忆配置，最后看当前会话上下文。三层各有分工，不会串。

第三步，写入强化。 查到东西还不算完，系统会顺手更新相关实体的页面，建立交叉引用，在时间线上追加新记录。查一次就多记一笔，越用记忆越完整。

不想折腾Postgres的用户，其实可以直接用它的Markdown知识模型和技能包，不需要完整的数据库后端。

想跑完整版的，三条命令搞定：

 
  
    
    
 
      
      
 
        
         
         1 
         
         
         2 
         
         
         3 
         
         
         4 
         
       
 
 
         
         bun add github:garrytan/gbrain
gbrain init –supabase
gbrain import ~/my_brain/
gbrain query “上次与OpenAI的合作进展如何？”

项目里带了完整的技能包文档，教你怎么让AI自动消化会议记录、生成每日简报、维护知识健康度。

说到底，GBrain做的事情并不新鲜。1945年Vannevar Bush就提出过Memex的概念，想让人类的数字记忆成为思维的延伸。七十多年过去了，终于有人把这个想法用现代技术栈落地了，还顺手开源了。

项目地址：

YC总裁开源了他在用的AI记忆系统：10000个文件里找东西，再也不用grep了

相关推荐