强化学习代理表示的选项集(批评者和参与者)
使用rlRepresentationOptions
对象指定评论家的选项集(rlValueRepresentation
,rlQValueRepresentation
)演员(决定论呈现
,随机表示
).
rlValueRepresentation |
强化学习agent的价值函数批评表示 |
rlQValueRepresentation |
强化学习agent的Q值函数批评表示 |
决定论呈现 |
强化学习代理的确定性参与者表示 |
随机表示 |
强化学习代理的随机参与者表示 |