小贝子编程

关于强化学习(RL)中的奖励问题

本文关键字：问题于强化学习 RL state action reinforcement-learning reward
更新时间 : 2023-09-22
英文 : question about reward in reinforcement learning (RL)

我有一个关于强化学习中的奖励的问题。这句话是真的吗?如果是，为什么呢?提前谢谢你

每次的奖励(对于来自相同状态的相同动作)不需要相同。

对于确定性完全信息博弈，这是正确的。想想围棋或国际象棋之类的游戏。但对于其他游戏来说，相同状态和动作的奖励主要取决于游戏当前的内部状态。

相关内容

最新更新