文档帮助中心
从强化学习环境或代理获取动作数据规范
actInfo = getActionInfo (env)
actInfo = getActionInfo(代理)
例子
actInfo= getActionInfo (env)从强化学习环境中提取动作信息env.
actInfo= getActionInfo (env)
actInfo
env
actInfo= getActionInfo (代理)从强化学习代理中提取动作信息代理.
actInfo= getActionInfo (代理)
代理
全部折叠
提取可用于创建其他环境或代理的操作和观察信息。
这个例子的强化学习环境是简单的纵向动力学的自我汽车和领先汽车。训练目标是让自我赛车以设定的速度行驶,同时通过控制纵向加速(和刹车)保持与领先赛车的安全距离。这个例子使用了与基于模型预测控制的自适应巡航控制系统(模型预测控制工具箱)的例子。
打开模型,创建强化学习环境。
mdl =“rlACCMdl”;open_system (mdl);agentblk = [mdl' / RL代理'];%创建观察信息obsInfo = rlNumericSpec([3 1],“LowerLimit”负无穷*的(1),“UpperLimit”,正* (3,1));obsInfo。Name =“观察”;obsInfo。描述=关于速度误差和自我速度的信息;%的动作信息actInfo = rlNumericSpec([1 1],“LowerLimit”3,“UpperLimit”2);actInfo。Name =“加速”;%定义环境env = rl金宝appSimulinkEnv (mdl agentblk、obsInfo actInfo)
env = 金宝appSimulinkEnvWithAgent with properties: Model: rlACCMdl AgentBlock: rlACCMdl/RL Agent ResetFcn: [] UseFastRestart: on
强化学习环境env是一个金宝appSimulinkWithAgent对象的上述属性。
金宝appSimulinkWithAgent
从强化学习环境中提取动作和观察信息env.
actInfoExt = getActionInfo (env)
actInfoExt = rlNumericSpec with properties: LowerLimit: -3 UpperLimit: 2 Name: "acceleration" Description: [0x0 string] Dimension: [1 1] DataType: "double"
obsInfoExt = getObservationInfo (env)
obsInfoExt = rlNumericSpec with properties: LowerLimit: [3x1 double] UpperLimit: [3x1 double] Name: "observations" Description: "information on velocity error and ego velocity" Dimension: [3 1] DataType: "double"
动作信息包含加速度值,观测信息包含自我车辆的速度和速度误差值。
金宝appSimulinkEnvWithAgent
强化学习环境,从其中行动信息必须被提取,指定为金宝appSimulinkEnvWithAgent对象。
有关强化学习环境的更多信息,请参见创建强化学习的金宝appSimulink环境.
rlQAgent
rlSARSAAgent
rlDQNAgent
rlDDPGAgent
rlPGAgent
rlACAgent
需要从中提取动作信息的强化学习agent,指定为以下对象之一:
有关强化学习代理的更多信息,请参见强化学习代理.
rlNumericSpec
rlFiniteSetSpec
从强化学习环境中提取的动作数据规范,返回为以下数组之一:
rlNumericSpec对象
rlFiniteSetSpec对象
的混合rlNumericSpec和rlFiniteSetSpec对象
getObservationInfo|rlACAgent|rlDDPGAgent|rlDQNAgent|rlFiniteSetSpec|rlNumericSpec|rlPGAgent|rlQAgent|rlSARSAAgent
getObservationInfo
在您的系统中存在这个示例的修改版本。你想打开这个版本吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系
得到审判现在