主要内容

getObservationInfo

从强化学习环境或agent获取观测数据规范

描述

例子

obsinfo.= getobservationInfo(env.从强化学习环境中提取观察信息env.

obsinfo.= getobservationInfo(代理人从钢筋学习代理中提取观察信息代理人

例子

全部收缩

提取您可以用于创建其他环境或代理的操作和观察信息。

本例的增强学习环境是自助式汽车和铅轿车的简单纵向动态。培训目标是使自助式汽车以设定的速度行进,同时通过控制纵向加速(和制动)保持与引线的安全距离。此示例使用相同的车型模型基于模型预测控制的自适应巡航控制系统(模型预测控制工具箱)例子。

打开模型并创建强化学习环境。

mdl ='rlaccmdl';Open_System(MDL);AppletBlk = [MDL'/ rl代理'];%创建观察信息obsInfo = rlNumericSpec([3 1],'lowerimit',-inf *那些(3,1),'上限',INF * of(3,1));ObsInfo.name =.'观察';Obsinfo.description =.“关于速度误差和自我速度的信息”;%行动信息Actinfo = rlnumericspec([1 1],'lowerimit',-3,'上限',2);Actinfo.name =.'加速';%定义环境Env = Rl金宝appsimulinkenv(MDL,AppertBlk,Obsinfo,Actinfo)
env = 金宝appSimulinkenvwithAgent具有属性:型号:RLACCMDL AppletBlock:RLACCMDL / RL代理RESETFCN:[] USEFASTRESTR:ON

强化学习环境env.是A.金宝appSimulinkWithAgent对象具有上述属性。

从加强学习环境中提取动作和观察信息env.

Actinfoext = GetActionInfo(ENV)
ACTINFOEXT = RLNUMERICSPEC具有属性:LowerMit:-3 Upperlimit:2名称:“加速”描述:[0x0字符串]尺寸:[1]数据类型:“double”
ObsInfoext = getobservationInfo(env)
obsInfoExt = rlNumericSpec with properties: LowerLimit: [3x1 double] UpperLimit: [3x1 double] Name: "observations" Description: "information on velocity error and ego velocity" Dimension: [3 1] DataType: "double"

动作信息包含加速度值,而观察信息包含自我车辆的速度和速度误差值。

输入参数

全部收缩

需要从其中提取观测信息的强化学习环境,指定为金宝appSimulinkenvwithagent.对象。

有关强化学习环境的更多信息,请参阅创建Simul金宝appink强化学习环境

需要提取观测信息的强化学习agent,指定为以下对象之一:

有关强化学习代理的更多信息,请参见加固学习代理人

输出参数

全部收缩

从强化学习环境中提取的观察数据规范,作为以下一系列返回:

在R2019A介绍