Garry Tan是谁不用多介绍了,YC现任总裁,硅谷最有话语权的早期投资人之一。他之前开源过一个叫gstack的工具包,已经炸过一波朋友圈,那东西说白了就是一整套产品开发的superpowers,从需求分析到上线全覆盖。
这次他又放了个更大的招 GBrain,一个个人AI记忆系统。
很多人在用AI Agent的时候都会碰到同一个坎:你给它喂了大量个人笔记、会议记录、日程安排,指望它能像个贴身秘书一样随时调取信息。但当你真的问它”上个月和OpenAI那次会议聊了什么”的时候,它大概率答不上来。
Garry Tan的数据量能说明问题:13年的日历数据,21000多个事件,5800条苹果笔记,280多条会议记录,300多条原创想法。这些全部存成Markdown文件,加起来一万多个。
一万多个文件,用grep搜一下试试?3000个文件以内还勉强能撑,过了这个线,响应时间直接从几毫秒飙到30秒以上。而且grep只能做关键词匹配,你问”找一些反常识的创业建议”,它完全没辙,因为这里面没有”反常识”三个字。
语义搜索和精确检索必须同时有,缺一个都不行。
GBrain的思路其实不复杂,但很实用。
搜索层用了两套引擎混着来。 一套是Postgres的tsvector做关键词检索,专门对付"找Pedro Franceschi的邮箱"这种精确查找。另一套是pgvector做向量搜索,负责语义匹配,"找关于反常识创业的建议"这种模糊查询就靠它。两路结果通过RRF算法融合排序,最后输出一个综合排名。
这个架构的好处是你不用二选一,精确的归精确,模糊的归模糊,各干各的活。
知识管理这块有个设计挺有意思,叫"编译事实+时间线"。 每个知识条目的顶部是动态更新的核心结论,随时可以改。底部是原始证据链,永远不动。这就像写论文,摘要可以反复改,但引用的文献和数据不能变。这样做的好处是AI在调取记忆的时候,既能拿到最新的结论,又能追溯原始出处。
还有一个我觉得很酷的功能,叫"夜间梦境循环"。 AI Agent在你不用它的时候(也就是"睡觉"的时候),会自动分析当天的对话记录,把断掉的引用链接修好,把碎片化的记忆合并到一起。说白了就是你不干活的时候,它在后台帮你整理笔记。
整个系统跑起来其实就是三步:
第一步,实体检测。 每条消息进来,自动识别里面提到的人、公司、概念。你聊了一句”昨天和李明聊了Q3的OKR”,系统就知道这里有两个实体:李明(人)、OKR(概念)。
第二步,三层查询。 先查GBrain里的世界知识,再查Agent自身的操作记忆配置,最后看当前会话上下文。三层各有分工,不会串。
第三步,写入强化。 查到东西还不算完,系统会顺手更新相关实体的页面,建立交叉引用,在时间线上追加新记录。查一次就多记一笔,越用记忆越完整。
不想折腾Postgres的用户,其实可以直接用它的Markdown知识模型和技能包,不需要完整的数据库后端。
想跑完整版的,三条命令搞定:
项目里带了完整的技能包文档,教你怎么让AI自动消化会议记录、生成每日简报、维护知识健康度。
说到底,GBrain做的事情并不新鲜。1945年Vannevar Bush就提出过Memex的概念,想让人类的数字记忆成为思维的延伸。七十多年过去了,终于有人把这个想法用现代技术栈落地了,还顺手开源了。
项目地址:
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容,请联系我们,一经查实,本站将立刻删除。
如需转载请保留出处:https://51itzy.com/kjqy/258936.html