文档帮助中心文档
从强化学习环境或代理中获取行动数据规格
actinfo = getActioninfo(env)
actinfo = getActionInfo(代理)
例子
Actinfo= getActioninfo(env)从强化学习环境中提取行动信息env。
Actinfo= getActioninfo(env)
Actinfo
env
Actinfo= getActioninfo(代理人)从增强学习代理中提取行动信息代理人。
Actinfo= getActioninfo(代理人)
代理人
全部收缩
提取可用于创建其他环境或代理的操作和观察信息。
此示例的增强学习环境是自我汽车和铅汽车的简单纵向动力学。训练目标是使自我汽车以设定的速度行驶,同时通过控制纵向加速(和制动)来保持与铅汽车的安全距离。此示例使用与使用模型预测控制的自适应巡航控制系统(模型预测控制工具箱)例子。
打开模型并创建强化学习环境。
mdl ='rlaccmdl';Open_System(MDL);AgentBlk = [MDL'/rl代理人'];%创建观察信息obsinfo = rlnumericspec([3 1],,“下限”,-inf*一个(3,1),“上限”,inf*一个(3,1));obsinfo.name =“观察”;obsinfo.Description =“有关速度错误和自我速度的信息”;%动作信息actinfo = rlnumericspec([1 1],,“下限”,-3,“上限”,2);actinfo.name =“加速”;%定义环境env = rl金宝appSimulinkenv(MDL,AgentBlk,obsinfo,actinfo)
env = 金宝appsimulinkenvwithagent具有属性:模型:rlaccmdl agentBlock:rlaccmdl/rl代理resetfcn:[] usefastrestart:on
增强学习环境env是一个金宝appsimulinkwithagent具有上述属性的对象。
金宝appsimulinkwithagent
从增强学习环境中提取动作和观察信息env。
actinfoext = getActionInfo(env)
ActInfoext = rlnumericspec带有属性:lowerLimit:-3 Upperlimit:2名称:“加速”描述:[0x0 String] dimension:[1 1] datatype:“ double”
obsinfoext = getObservationinfo(env)
obsinfoext = rlnumericspec具有属性:下限:[3x1 double]上限:[3x1 double]名称:“观察”描述:“有关速度错误和自我速度的信息”,“尺寸:[3 1] datatype:[3 1] datatype:“ double”“ double”“
动作信息包含加速度值,而观察信息包含自我车辆的速度和速度误差值。
金宝appsimulinkenvwithagent
强化学习环境必须从中提取动作信息,并指定为金宝appsimulinkenvwithagent目的。
有关强化学习环境的更多信息,请参阅创建Simul金宝appink增强学习环境。
rlqagent
rlsarsaagent
rldqnagent
rlddpgagent
rlpgagent
rlacagent
必须从中提取动作信息的强化学习代理,并将其指定为以下对象之一:
有关强化学习代理的更多信息,请参阅强化学习者。
rlnumericspec
rlfinitesetspec
从强化学习环境中提取的动作数据规格作为以下一个数组返回:
rlnumericspec对象
rlfinitesetspec对象
混合rlnumericspec和rlfinitesetspec对象
GetObservationinfo|rlacagent|rlddpgagent|rldqnagent|rlfinitesetspec|rlnumericspec|rlpgagent|rlqagent|rlsarsaagent
GetObservationinfo
您有此示例的修改版本。您想用您的编辑打开这个示例吗?
您单击了与此MATLAB命令相对应的链接:
通过在MATLAB命令窗口中输入该命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站以获取可用的翻译内容,并查看本地事件和优惠。根据您的位置,我们建议您选择:。
您还可以从以下列表中选择一个网站:
选择中国网站(中文或英语)以获得最佳场地性能。其他Mathworks乡村网站未针对您所在的访问进行优化。
联系您当地的办公室