为强化学习代理人表示设置选项(评论家和演员)
rlValueRepresentation |
为强化学习代理商的价值功能评论家表示 |
rlQValueRepresentation |
增强学习代理的q值函数批评表示 |
rlDeterministicActorRepresentation |
为强化学习代理商确定性演员表现 |
rlStochasticActorRepresentation |
为强化学习代理随机演员表现 |