rlTable
值表或Q表
描述
值表和Q表是表示强化学习的评价网络的一种方法。值表存储有限组观察的奖励。Q表存储相应有限观察-动作对的奖励。
创建值函数逼近器rlTable
对象,使用rlValueFunction
,rlQValueFunction
,或rlVectorQValueFunction
对象。
创建
输入参数
属性
对象的功能
rlValueFunction |
强化学习代理的值函数逼近对象 |
rlQValueFunction |
强化学习代理的q值函数逼近对象 |
rlVectorQValueFunction |
向量q值函数逼近强化学习代理 |