getModel

从演员或评论家得到函数近似者模型

自从R2020b

所有的页面崩溃

语法

模型= getModel (fcnAppx)

描述

例子

模型= getModel (fcnAppx)返回函数的近似模型使用的演员或评论家函数对象fcnAppx。

例子

全部折叠

在强化学习修改深层神经网络代理

打开生活的脚本

创造一个环境,一个连续的操作空间和获得其观察和操作规范。对于这个示例,负载在示例中使用的环境火车DDPG剂来控制双积分器系统。

负载预定义的环境。

env = rlPredefinedEnv (“DoubleIntegrator-Continuous”);

获得观察和操作规范。

obsInfo = getObservationInfo (env);actInfo = getActionInfo (env);

创建PPO代理从环境中观察和操作规范。该代理使用默认深层神经网络的演员和评论家。

代理= rlPPOAgent (obsInfo actInfo);

修改强化学习中的深层神经网络代理,您必须首先提取演员和评论家函数近似者。

演员= getActor(代理);评论家= getCritic(代理);

从演员和提取深层神经网络评论家函数近似者。

actorNet = getModel(演员);criticNet = getModel(批评);

网络是dlnetwork对象。查看使用情节功能,您必须将它们转换为layerGraph对象。

例如,查看演员网络。

情节(layerGraph (actorNet))

图包含一个坐标轴对象。坐标轴graphplot类型的对象包含一个对象。

验证一个网络,使用analyzeNetwork。例如,验证网络评论家。

analyzeNetwork (criticNet)

您可以修改演员和评论家网络和拯救他们回代理。修改网络,您可以使用深层网络设计师为每个网络应用。打开应用程序,使用下面的命令。

deepNetworkDesigner (layerGraph (criticNet) deepNetworkDesigner (layerGraph (actorNet))

在深层网络设计师,修改网络。例如,您可以添加额外的层网络。当你修改网络,不改变网络的输入和输出层返回的getModel。建立网络的更多信息,见构建网络与深度网络设计师。

验证修改后的网络深层网络设计师,你必须点击分析了dlnetwork下,分析部分。出口MATLAB®工作区中修改后的网络结构,生成代码来创建新网络和从命令行运行这段代码。不使用导出选项深层网络设计师。为例,展示了如何生成并运行代码,看看创建DQN代理使用深层网络设计师和训练使用图像的观察。

对于这个示例,创建的代码修改的演员和评论家网络createModifiedNetworks辅助脚本。

createModifiedNetworks

每个网络包括一个额外的修改fullyConnectedLayer和reluLayer在他们的主要常见的路径。查看修改后的演员网络。

情节(layerGraph (modifiedActorNet))

图包含一个坐标轴对象。坐标轴graphplot类型的对象包含一个对象。

出口网络后,网络插入演员和评论家函数近似者。

演员= setModel(演员,modifiedActorNet);评论家= setModel(评论家,modifiedCriticNet);

最后,将修改后的演员兼评论家函数近似者插入到演员和批评的对象。

代理= setActor(代理、演员);代理= setCritic(代理、批评);

输入参数

全部折叠

`fcnAppx`- - - - - -演员或评论家函数对象
`rlValueFunction`对象|`rlQValueFunction`对象|`rlVectorQValueFunction`对象|`rlContinuousDeterministicActor`对象|`rlDiscreteCategoricalActor`对象|`rlContinuousGaussianActor`对象

演员或评论家函数对象,指定为以下之一:

rlValueFunction对象-值函数评论家
rlQValueFunction对象-核反应能量函数评论家
rlVectorQValueFunction对象——多输出核反应能量函数批评一个离散的行动空间
rlContinuousDeterministicActor对象——确定性政策参与者与连续操作空间
rlDiscreteCategoricalActor——随机政策演员与一个离散的行动空间
rlContinuousGaussianActor对象——随机政策参与者与连续操作空间

创建一个演员或评论家函数对象,使用下列方法之一。

直接创建一个函数对象。
从代理使用获取现有的评论家getCritic。
从代理使用获取现有的演员getActor。

请注意

代理有超过一位评论家,如TD3和囊药物,您必须调用getModel单独为每个评论家表示,而不是打电话getModel返回的数组getCritic。

批评者= getCritic (myTD3Agent);criticNet1 = getModel(批评者(1));criticNet2 = getModel(批评者(2));

输出参数

全部折叠

`模型`——函数近似模型
`dlnetwork`对象|`rlTable`对象| 1×2单元阵列

函数的近似模型,作为以下之一:返回

神经网络定义为一个dlnetwork对象
rlTable对象
1×2单元阵列包含函数处理为一个自定义的基函数和基函数的参数

版本历史

介绍了R2020b

全部展开

R2022a:`getModel`现在使用近似者对象而不是表示对象

使用表示对象为强化学习代理创建演员和批评不再推荐。因此,getModel现在使用函数近似者而不是对象。

R2021b:`getModel`返回一个`dlnetwork`对象

从R2021b,内置代理使用dlnetwork对象作为演员和评论家表示getModel返回一个dlnetwork对象。

由于网络计算中的数值差异,以前训练特工的行为可能会有所不同。如果发生这种情况,你可以训练你的代理。
使用深度学习工具箱™函数不支持金宝appdlnetwork,你必须把网络layerGraph。例如,使用deepNetworkDesigner、替换deepNetworkDesigner(网络)与deepNetworkDesigner (layerGraph(网络)。

另请参阅

getModel

语法

描述

例子

在强化学习修改深层神经网络代理

输入参数

fcnAppx- - - - - -演员或评论家函数对象rlValueFunction对象|rlQValueFunction对象|rlVectorQValueFunction对象|rlContinuousDeterministicActor对象|rlDiscreteCategoricalActor对象|rlContinuousGaussianActor对象

输出参数

模型——函数近似模型dlnetwork对象|rlTable对象| 1×2单元阵列

版本历史

R2022a:getModel现在使用近似者对象而不是表示对象

R2021b:getModel返回一个dlnetwork对象

另请参阅

功能

对象

主题

`fcnAppx`- - - - - -演员或评论家函数对象
`rlValueFunction`对象|`rlQValueFunction`对象|`rlVectorQValueFunction`对象|`rlContinuousDeterministicActor`对象|`rlDiscreteCategoricalActor`对象|`rlContinuousGaussianActor`对象

`模型`——函数近似模型
`dlnetwork`对象|`rlTable`对象| 1×2单元阵列

R2022a:`getModel`现在使用近似者对象而不是表示对象

R2021b:`getModel`返回一个`dlnetwork`对象