getObservationInfo

从强化学习环境或agent获取观测数据规范

页面上倒塌

句法

ObsInfo = getobservationInfo（Env）

ObsInfo = getobservationInfo（代理）

描述

例子

obsinfo.= getobservationInfo（env.）从强化学习环境中提取观察信息env.。

obsinfo.= getobservationInfo（代理人）从钢筋学习代理中提取观察信息代理人。

例子

全部收缩

从强化学习环境中提取动作和观察信息

打开生活的脚本

提取您可以用于创建其他环境或代理的操作和观察信息。

本例的增强学习环境是自助式汽车和铅轿车的简单纵向动态。培训目标是使自助式汽车以设定的速度行进，同时通过控制纵向加速（和制动）保持与引线的安全距离。此示例使用相同的车型模型基于模型预测控制的自适应巡航控制系统（模型预测控制工具箱）例子。

打开模型并创建强化学习环境。

mdl ='rlaccmdl';Open_System（MDL）;AppletBlk = [MDL'/ rl代理'];％创建观察信息obsInfo = rlNumericSpec([3 1]，'lowerimit'，-inf *那些（3,1），'上限'，INF * of（3,1））;ObsInfo.name =.'观察';Obsinfo.description =.“关于速度误差和自我速度的信息”;％行动信息Actinfo = rlnumericspec（[1 1]，'lowerimit'，-3，'上限'，2）;Actinfo.name =.'加速';%定义环境Env = Rl金宝appsimulinkenv（MDL，AppertBlk，Obsinfo，Actinfo）

env = 金宝appSimulinkenvwithAgent具有属性：型号：RLACCMDL AppletBlock：RLACCMDL / RL代理RESETFCN：[] USEFASTRESTR：ON

强化学习环境env.是A.金宝appSimulinkWithAgent对象具有上述属性。

从加强学习环境中提取动作和观察信息env.。

Actinfoext = GetActionInfo（ENV）

ACTINFOEXT = RLNUMERICSPEC具有属性：LowerMit：-3 Upperlimit：2名称：“加速”描述：[0x0字符串]尺寸：[1]数据类型：“double”

ObsInfoext = getobservationInfo（env）

obsInfoExt = rlNumericSpec with properties: LowerLimit: [3x1 double] UpperLimit: [3x1 double] Name: "observations" Description: "information on velocity error and ego velocity" Dimension: [3 1] DataType: "double"

动作信息包含加速度值，而观察信息包含自我车辆的速度和速度误差值。