主要内容

getActioninfo

从强化学习环境或代理中获取行动数据规格

描述

例子

Actinfo= getActioninfo(env从强化学习环境中提取行动信息env

Actinfo= getActioninfo(代理人从增强学习代理中提取行动信息代理人

例子

全部收缩

提取可用于创建其他环境或代理的操作和观察信息。

此示例的增强学习环境是自我汽车和铅汽车的简单纵向动力学。训练目标是使自我汽车以设定的速度行驶,同时通过控制纵向加速(和制动)来保持与铅汽车的安全距离。此示例使用与使用模型预测控制的自适应巡航控制系统(模型预测控制工具箱)例子。

打开模型并创建强化学习环境。

mdl ='rlaccmdl';Open_System(MDL);AgentBlk = [MDL'/rl代理人'];%创建观察信息obsinfo = rlnumericspec([3 1],,“下限”,-inf*一个(3,1),“上限”,inf*一个(3,1));obsinfo.name =“观察”;obsinfo.Description =“有关速度错误和自我速度的信息”;%动作信息actinfo = rlnumericspec([1 1],,“下限”,-3,“上限”,2);actinfo.name =“加速”;%定义环境env = rl金宝appSimulinkenv(MDL,AgentBlk,obsinfo,actinfo)
env = 金宝appsimulinkenvwithagent具有属性:模型:rlaccmdl agentBlock:rlaccmdl/rl代理resetfcn:[] usefastrestart:on

增强学习环境env是一个金宝appsimulinkwithagent具有上述属性的对象。

从增强学习环境中提取动作和观察信息env

actinfoext = getActionInfo(env)
ActInfoext = rlnumericspec带有属性:lowerLimit:-3 Upperlimit:2名称:“加速”描述:[0x0 String] dimension:[1 1] datatype:“ double”
obsinfoext = getObservationinfo(env)
obsinfoext = rlnumericspec具有属性:下限:[3x1 double]上限:[3x1 double]名称:“观察”描述:“有关速度错误和自我速度的信息”,“尺寸:[3 1] datatype:[3 1] datatype:“ double”“ double”“

动作信息包含加速度值,而观察信息包含自我车辆的速度和速度误差值。

输入参数

全部收缩

强化学习环境必须从中提取动作信息,并指定为金宝appsimulinkenvwithagent目的。

有关强化学习环境的更多信息,请参阅创建Simul金宝appink增强学习环境

必须从中提取动作信息的强化学习代理,并将其指定为以下对象之一:

有关强化学习代理的更多信息,请参阅强化学习者

输出参数

全部收缩

从强化学习环境中提取的动作数据规格作为以下一个数组返回:

在R2019a中引入