SAC特工的选择
使用一个rlSACAgentOptions
对象指定软演员评论(SAC)代理的选项。要创建SAC特工,请使用rlSACAgent
.
有关更多信息,请参见软Actor-Critic代理.
有关不同类型的强化学习代理的更多信息,请参见强化学习代理.
rlSACAgent |
软演员-评论家强化学习代理 |
Richard S. Sutton和Andrew G. Barto。强化学习:简介.第二版。自适应计算和机器学习。麻省理工学院出版社,2018年。