深度Q网络强化学习agent
深度q -网络(DQN)算法是一种无模型、在线、非策略的强化学习方法。DQN代理是一种基于价值的强化学习代理,它训练批评者来估计回报或未来的回报。DQN是q学习的一种变体,它只在离散的动作空间内运行。
使用默认初始化选项为具有给定观察和操作规范的环境创建DQN代理。代理中的批评家表示使用根据观察规范构建的默认多输出Q值深度神经网络代理人
= rlDQNAgent (observationInfo
,actionInfo
)observationInfo
以及动作规范actionInfo
.
为具有给定的观察和操作规范的环境创建DQN代理。属性中指定的选项配置的默认网络代理人
= rlDQNAgent (observationInfo
,actionInfo
,初始选项
)初始选项
有关初始化选项的详细信息,请参阅rlAgentInitializationOptions
.
使用为DQN代理设置的默认选项创建具有指定网络的DQN代理。代理人
= rlDQNAgent (批评家
)