文档帮助中心文档
从强化学习环境或代理获得观察数据规范
obsInfo = getObservationInfo (env)
obsInfo = getObservationInfo(代理)
例子
obsInfo= getObservationInfo (env)从强化学习环境中提取观测信息env.
obsInfo= getObservationInfo (env)
obsInfo
env
obsInfo= getObservationInfo (代理)从强化学习代理中提取观测信息代理.
obsInfo= getObservationInfo (代理)
代理
全部折叠
提取可用于创建其他环境或代理的操作和观察信息。
这个例子的强化学习环境是简单的纵向动力学的自我汽车和领先汽车。训练目标是让自我赛车以设定的速度行驶,同时通过控制纵向加速(和刹车)保持与领先赛车的安全距离。这个例子使用了与基于模型预测控制的自适应巡航控制系统(模型预测控制工具箱)的例子。
打开模型,创建强化学习环境。
mdl =“rlACCMdl”;open_system (mdl);agentblk = [mdl' / RL代理'];%创建观察信息ObsInfo = rlnumericspec([3 1],“LowerLimit”负无穷*的(1),“UpperLimit”,正* (3,1));obsInfo。Name =“观察”;obsInfo。描述=关于速度误差和自我速度的信息;%的动作信息actInfo = rlNumericSpec([1 1],“LowerLimit”3,“UpperLimit”2);actInfo。Name =“加速”;%定义环境env = rl金宝appSimulinkEnv (mdl agentblk、obsInfo actInfo)
env = 金宝appSimulinkEnvWithAgent with properties: Model: rlACCMdl AgentBlock: rlACCMdl/RL Agent ResetFcn: [] UseFastRestart: on
强化学习环境env是一个金宝appsimulinkwithagent.对象的上述属性。
金宝appsimulinkwithagent.
从强化学习环境中提取动作和观察信息env.
actInfoExt = getActionInfo (env)
actInfoExt = rlNumericSpec with properties: LowerLimit: -3 UpperLimit: 2 Name: "acceleration" Description: [0x0 string] Dimension: [1 1] DataType: "double"
obsInfoExt = getObservationInfo (env)
ObsInfoext = RLNumericsPec具有属性:LowerMit:[3x1 Double] UpperRimit:[3x1 Double]名称:“观察”描述:“速度误差和自我速度的信息”尺寸:[3 1]数据类型:“DOUBLE”
动作信息包含加速度值,观测信息包含自我车辆的速度和速度误差值。
金宝appSimulinkEnvWithAgent
必须提取观察信息的强化学习环境,指定为a金宝appSimulinkEnvWithAgent目的。
有关强化学习环境的更多信息,请参见创建Simul金宝appink强化学习环境.
rlQAgent
rlSARSAAgent
rlDQNAgent
rlDDPGAgent
rlPGAgent
rlACAgent
必须提取观察信息的加强学习代理,指定为以下对象之一:
有关强化学习代理商的更多信息,请参阅强化学习代理.
rlNumericSpec
rlFiniteSetSpec
从强化学习环境中提取的观察数据规范,返回为以下数组之一:
rlNumericSpec对象
rlFiniteSetSpec对象
的混合rlNumericSpec和rlFiniteSetSpec对象
getActionInfo|rlACAgent|rlDDPGAgent|rlDQNAgent|rlFiniteSetSpec|rlNumericSpec|rlPGAgent|rlQAgent|rlSARSAAgent
getActionInfo
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系