rlTable
值表或者Q表
描述
值表和Q表代表批评网络强化学习的一种方式。值表存储奖励一套有限的观测。问表存储相应回报有限observation-action对。
创建一个函数近似者使用一个值rlTable
对象,使用一个rlValueFunction
,rlQValueFunction
,或rlVectorQValueFunction
对象。
创建
输入参数
属性
对象的功能
rlValueFunction |
值函数近似者对象强化学习代理 |
rlQValueFunction |
为强化学习代理核反应能量函数近似者对象 |
rlVectorQValueFunction |
向量核反应能量函数近似者强化学习代理 |