深度q -网络强化学习代理
Deep Q-Network(DQN)算法是一种无模型,在线,禁止策略强化学习方法。DQN代理是一个基于价值的强化学习代理,可以训练批准批评奖励或未来奖励。DQN是Q-Learning的变体,它仅在离散动作空间内运行。
有关更多信息,深度Q-Network代理商.有关不同类型的强化学习代理商的更多信息,请参阅强化学习代理.
使用默认初始化选项创建具有给定观察和操作规范的环境的DQN代理。代理中的批评批评代表使用从观察规范构建的默认多输出Q值深神经网络代理
= rlDQNAgent (observationInfo
,actionInfo
)observationInfo
以及动作规范actionInfo
.
使用给定的观察和操作规范创建一个环境的DQN代理。代理使用使用指定的选项配置的默认网络代理
= rlDQNAgent (observationInfo
,actionInfo
,初学者
)初学者
对象。有关初始化选项的更多信息,请参见rlAgentInitializationOptions
.
使用为DQN代理程序设置的默认选项创建DQN代理使用指定的批评网络。代理
= rlDQNAgent (评论家
)