getActionInfo

从强化学习环境或代理获取行动数据规范

折叠所有页面

语法

actInfo=getActionInfo（环境）

actInfo=getActionInfo（代理）

描述

实例

肌动蛋白= getActionInfo (环境)从强化学习环境中提取动作信息环境.

肌动蛋白= getActionInfo (代理人)从强化学习代理中提取动作信息代理人.

例子

全部崩溃

从强化学习环境中提取动作和观察信息

打开生活的脚本

提取可用于创建其他环境或代理的操作和观察信息。

本示例中的强化学习环境是ego car和lead car的简单纵向动力学。培训目标是通过控制纵向加速度（和制动），使ego car以设定速度行驶，同时保持与lead car的安全距离。本示例使用与基于模型预测控制的自适应巡航控制系统（模型预测控制工具箱）实例

打开模型并创建强化学习环境。

mdl=“rlACCMdl”; 开放式系统（mdl）；agentblk=[mdl“/RL代理”];%创建观察信息obsInfo = rlNumericSpec([3 1]，“LowerLimit”，-inf*one（3,1），“上限”，inf*one（3,1））；obsInfo.Name=“观察”; obsInfo.Description=“速度误差和速度信息”;%行动信息actInfo=rlNumericSpec（[1]，“LowerLimit”3,“上限”,2); actInfo.Name=“加速”;%定义环境env=rlSi金宝appmulinkEnv（mdl、agentblk、obsInfo、actInfo）

env=Si金宝appmulinkEnvWithAgent，属性为：模型：rlACCMdl AgentBlock:rlACCMdl/RL Agent ResetFcn:[]使用快速重启：打开

强化学习环境环境是一个金宝appSimulinkWithAgent对象的上述属性。

从强化学习环境中提取行动和观察信息环境.

actInfoExt=getActionInfo（环境）

ActionFoText=rlNumericSpec，属性：LowerLimit:-3上限：2名称：“加速度”说明：[0x0字符串]维度：[1]数据类型：“双”

obsInfoExt=getObservationInfo（env）

obsInfoExt = rlNumericSpec with properties: LowerLimit: [3x1 double] UpperLimit: [3x1 double] Name: "observations" Description: "information on velocity error and ego velocity" Dimension: [3 1] DataType: "double"

动作信息包含加速度值，而观察信息包含车辆的速度和速度误差值。