主要内容

rlnumericspec.

为强化学习环境创建连续动作或观察数据规范

描述

一个rlnumericspec.Object指定用于强化学习环境的连续动作或观察数据规范。

创建

描述

例子

规范= rlnumericspec(为连续动作或观察创建数据规范,并设置尺寸财产。

规范= rlnumericspec(名称,价值特性使用名称值对参数。

特性

展开全部

数据空间的下限,指定为与数据空间相同大小的标量或矩阵。什么时候LowerLimit被指定为标量,rlnumericspec.将其应用于数据空间中的所有条目。

数据空间的上限,指定为与数据空间相同的标量或矩阵。什么时候上限被指定为标量,rlnumericspec.将其应用于数据空间中的所有条目。

的名字rlnumericspec.对象,指定为字符串。

对。的描述rlnumericspec.对象,指定为字符串。

此属性是只读的。

数据空间的维数,指定为数字向量。

此属性是只读的。

有关数据类型的信息,指定为字符串。

对象功能

Rl金宝appsimulinkenv. 使用中实现的动态模型创建强化学习环境金宝app
rlFunctionEnv 使用函数指定自定义强化学习环境动态
rlrepresentation (不推荐)强化学习代理的模型表示

例子

全部收缩

对于这个例子,请考虑Rlsimplepentulummodel.金宝app仿真软件模型。这个模型是一个简单的无摩擦摆,它最初是向下悬挂的。

打开模型。

mdl =“rlSimplePendulumModel”;open_system (mdl)

创建rlnumericspec.rlfinitesetspec.对象分别用于观察和动作信息。

obsInfo = rlNumericSpec([3 1])%向量3个观测值:sin cos d /dt
obsInfo = rlnumericspec与属性:lowerlimit:-inf上唇:inf name:[0x0字符串]描述:[0x0字符串]尺寸:[3 1]数据类型:“double”
Actinfo = rlfinitesetspec([ -  2 0 2])扭矩的%3可能的值:-2 nm,0 nm和2nm
ActInfo = rlfinitesetspec,具有属性:元素:[3x1 double]名称:[0x0字符串]描述:[0x0字符串]尺寸:[1 1]数据类型:“DOUBLE”

您可以使用DOT表示法为分配属性值rlnumericspec.rlfinitesetspec.对象。

ObsInfo.name =.'观察';Actinfo.name =.'扭矩';

分配代理块路径信息,并使用先前步骤中提取的信息创建用于Simulink模型的增强学习环境。金宝app

agentBlk = [mdl'/ rl代理'];Env = Rl金宝appsimulinkenv(MDL,AppertBlk,Obsinfo,Actinfo)
Env = 金宝appSimulinkenvwithAgent with属性:型号:rlsimplepentulummodel agentblock:rlsimpleveptulummodel / rl代理resetfcn:[] UseFastrest:ON

您还可以使用点表示法包含重置功能。对于此示例,随机初始化Theta0.在模型工作区中。

env.resetfcn = @(in)setVariable(在,“theta0”,randn,'工作区'mdl)
env = 金宝appSimulinkEnvWithAgent with properties: Model: rlSimplePendulumModel AgentBlock: rlSimplePendulumModel/RL Agent ResetFcn: @(in)setVariable(in,'theta0',randn,'Workspace',mdl) UseFastRestart: on
在R2019A介绍