主要内容

rlNumericSpec

为强化学习环境创建持续的动作或观察数据规范

描述

一个rlNumericSpec对象为强化学习环境指定持续的动作或观察数据规范。

创建

描述

例子

规范= rlNumericSpec (为连续操作或观察创建数据规范,并设置财产。

规范= rlNumericSpec (名称,值属性使用名称-值对参数。

属性

全部展开

数据空间的下限,指定为与数据空间大小相同的标量或矩阵。当LowerLimit被指定为标量,rlNumericSpec将其应用于数据空间中的所有条目。

数据空间的上限,指定为与数据空间大小相同的标量或矩阵。当UpperLimit被指定为标量,rlNumericSpec将其应用于数据空间中的所有条目。

项目名称rlNumericSpec对象,指定为字符串。

项目描述rlNumericSpec对象,指定为字符串。

此属性是只读的。

数据空间的维数,指定为数值向量。

此属性是只读的。

有关数据类型的信息,以字符串形式指定,例如“替身”“单身”

对象的功能

rl金宝appSimulinkEnv 使用动态模型创建强化学习环境金宝app
rlFunctionEnv 使用函数指定自定义强化学习环境动态
rlValueFunction 强化学习代理的值函数逼近对象
rlQValueFunction 强化学习代理的q值函数逼近对象
rlVectorQValueFunction 向量q值函数逼近强化学习代理
rlContinuousDeterministicActor 具有连续动作空间的确定性行为体用于强化学习代理
rlDiscreteCategoricalActor 具有离散动作空间的随机分类actor强化学习代理
rlContinuousGaussianActor 一种具有连续动作空间的随机高斯体强化学习代理

例子

全部折叠

对于本例,考虑rlSimplePendulumModel金宝app仿真软件模型。模型是一个简单的无摩擦摆,最初悬挂在一个向下的位置。

打开模型。

mdl =“rlSimplePendulumModel”;open_system (mdl)

创建rlNumericSpec而且rlFiniteSetSpec对象分别用于观察和操作信息。

观测值是一个包含三个信号的向量:角度的正弦、余弦和时间导数。

obsInfo = rlNumericSpec([3 1])
obsInfo = rlNumericSpec with properties: LowerLimit: -Inf UpperLimit: Inf名称:[0×0 string]描述:[0×0 string]维度:[3 1]DataType: "double"

动作是表示扭矩的标量,可以是三个可能值之一,-2海里,0纳米和2Nm。

rlFiniteSetSpec([-2 0 2])
actInfo = rlFiniteSetSpec with properties:元素:[3×1 double]名称:[0×0 string]描述:[0×0 string]维度:[1 1]数据类型:"double"

属性的属性值可以使用点表示法rlNumericSpec而且rlFiniteSetSpec对象。

obsInfo。Name =“观察”;actInfo。Name =“扭矩”

分配代理块路径信息,并使用前面步骤中提取的信息为Simulink模型创建强化学习环境。金宝app

agentBlk = [mdl .' / RL代理'];env = rl金宝appSimulinkEnv(mdl,agentBlk,obsInfo,actInfo)
env = 金宝appSimulinkEnvWithAgent with properties: Model: rlSimplePendulumModel AgentBlock: rlSimplePendulumModel/RL Agent ResetFcn: [] UseFastRestart: on

您还可以使用点表示法包含一个重置函数。对于本例,随机初始化theta0在模型工作区中。

env。ResetFcn = @(in) setVariable(in,“theta0”randn,“工作区”mdl)
env = 金宝appSimulinkEnvWithAgent with properties: Model: rlSimplePendulumModel AgentBlock: rlSimplePendulumModel/RL Agent ResetFcn: @(in)setVariable(in,'theta0',randn,'Workspace',mdl) UseFastRestart: on

版本历史

在R2019a中引入