rlQAgent
Q-learning强化学习代理
描述
Q-learning算法是一种无模型、在线、非策略强化学习方法。Q-learning代理是一种基于价值的强化学习代理,它训练一个评论家来估计回报或未来的奖励。
有关q学习代理的更多信息,请参见q学习的代理.
有关不同类型的强化学习代理的更多信息,请参见强化学习代理.
属性
对象的功能
例子
版本历史
在R2019a中引入
Q-learning强化学习代理
Q-learning算法是一种无模型、在线、非策略强化学习方法。Q-learning代理是一种基于价值的强化学习代理,它训练一个评论家来估计回报或未来的奖励。
有关q学习代理的更多信息,请参见q学习的代理.
有关不同类型的强化学习代理的更多信息,请参见强化学习代理.
在R2019a中引入