深度q -网络强化学习代理
深度q -网络(deep Q-network, DQN)算法是一种无模型、在线、非策略强化学习方法。DQN代理是一种基于价值的强化学习代理,它训练评论家来估计回报或未来的奖励。DQN是q学习的一种变体,它只在离散的动作空间中起作用。
使用默认初始化选项为具有给定观察和操作规范的环境创建DQN代理。代理中的评论家表示使用从观察规范构建的默认多输出q值深度神经网络代理
= rlDQNAgent (observationInfo
,actionInfo
)observationInfo
以及动作规范actionInfo
.
使用给定的观察和操作规范为环境创建DQN代理。属性中指定的选项配置的默认网络代理
= rlDQNAgent (observationInfo
,actionInfo
,initOpts
)initOpts
对象。有关初始化选项的详细信息,请参见rlAgentInitializationOptions
.
使用为DQN代理设置的默认选项创建具有指定评论家网络的DQN代理。代理
= rlDQNAgent (评论家
)
使用指定的临界网络创建DQN代理,并设置代理
= rlDQNAgent (评论家
,agentOptions
)AgentOptions
属性agentOptions
输入参数。在前面语法中的任何输入参数后使用此语法。