深Q-network强化学习代理
深Q-network (DQN)算法是一个模范自由,在网上,off-policy强化学习方法。DQN代理是一个基于价值观的强化学习代理列车评论家估计返回或未来的回报。DQN是q学习的变体,它操作只在离散的行动空间。
有关更多信息,深Q-Network代理。更多信息在不同类型的强化学习代理,看看强化学习代理。
创建一个DQN代理一个环境与给定的观察和操作规范,使用默认初始化选择。评论家表示代理使用一个默认的多输出核反应能量深层神经网络由观测规范代理
= rlDQNAgent (observationInfo
,actionInfo
)observationInfo
和操作规范actionInfo
。
创建一个DQN代理一个环境与给定的观察和操作规范。代理使用一个默认网络配置使用选项中指定代理
= rlDQNAgent (observationInfo
,actionInfo
,initOpts
)initOpts
对象。初始化选项的更多信息,请参阅rlAgentInitializationOptions
。
创建一个DQN代理指定的评论家网络使用默认选项设置DQN代理。代理
= rlDQNAgent (评论家
)
创建一个DQN代理指定的评论家网络和设置代理
= rlDQNAgent (评论家
,agentOptions
)AgentOptions
财产agentOptions
输入参数。使用这个语法后的任何输入参数在前面的语法。