getLearnableParameters

从策略或值函数表示中获取可学习的参数值

折叠所有页面

语法

val = getLearnableParameters(代表)

描述

例子

瓦尔= getLearnableParameters (代表）从强化学习策略或值函数表示形式返回可学习参数的值代表．

例子

全部折叠

修改批评家参数值

打开生活的脚本

假设您有一个现有的经过训练的强化学习代理。对于本例，从下面加载经过训练的代理培训DDPG Agent控制双积分系统．

负载(“DoubleIntegDDPG.mat”，“代理”）

从代理获取批评家表示。

评论家= getCritic(代理);

从评论家那里获取可学习的参数。

params = getLearnableParameters(批评);

修改参数值。对于本例，只需将所有参数乘以2．

@(x) x*2，“UniformOutput”、假);

将批评家的参数值设置为修改后的值。

评论家= setLearnableParameters(评论家,modifiedParams);

将代理中的评论家设置为新的修改过的评论家。

代理= setCritic(代理、批评);

修改Actor参数值

打开生活的脚本

假设您有一个现有的经过训练的强化学习代理。对于本例，从下面加载经过训练的代理培训DDPG Agent控制双积分系统．

负载(“DoubleIntegDDPG.mat”，“代理”）

从代理获取参与者表示。

演员= getActor(代理);

从参与者那里获得可学习的参数。

params = getLearnableParameters(演员);

修改参数值。对于本例，只需将所有参数乘以2．

@(x) x*2，“UniformOutput”、假);

将参与者的参数值设置为新的修改值。

演员= setLearnableParameters(演员,modifiedParams);

将代理中的参与者设置为新修改的参与者。

代理= setActor(代理、演员);

输入参数

全部折叠

`代表`- - - - - -策略或值函数表示
`rlValueRepresentation`对象|`rlQValueRepresentation`对象|`rlDeterministicActorRepresentation`对象|`rlStochasticActorRepresentation`对象

策略或值函数表示，指定为下列之一:

rlValueRepresentation对象-值函数表示
rlQValueRepresentation对象- q值函数表示
rlDeterministicActorRepresentationobject -具有确定性动作的Actor表示
rlStochasticActorRepresentation随机动作的对象-行动者表示

要创建策略或值函数表示，请使用以下方法之一:

使用相应的表示对象创建表示。
使用。从代理获取现有值函数表示getCritic
使用。从代理获取现有策略表示getActor．

输出参数

全部折叠

`瓦尔`—可学习的参数值
单元阵列

表示对象的可学习参数值，作为单元格数组返回。属性在原始代理或不同的代理中修改这些参数值并设置它们setLearnableParameters函数。

兼容性的考虑

全部展开

`getLearnableParameterValues`现在是`getLearnableParameters`

行为在R2020a中改变

getLearnableParameterValues现在是getLearnableParameters．要更新代码，请更改函数名getLearnableParameterValues来getLearnableParameters．语法是等价的。

另请参阅

setLearnableParameters|getActor|getCritic|setActor|setCritic

主题

介绍了R2019a

强化学习工具箱文档

金宝app

强化学习与MATLAB和Simulink金宝app

下载电子书

getLearnableParameters

语法

描述

例子

修改批评家参数值

修改Actor参数值

输入参数

代表- - - - - -策略或值函数表示rlValueRepresentation对象|rlQValueRepresentation对象|rlDeterministicActorRepresentation对象|rlStochasticActorRepresentation对象

输出参数

瓦尔—可学习的参数值单元阵列

兼容性的考虑

getLearnableParameterValues现在是getLearnableParameters

另请参阅

主题

强化学习工具箱文档

金宝app

强化学习与MATLAB和Simulink金宝app

`代表`- - - - - -策略或值函数表示
`rlValueRepresentation`对象|`rlQValueRepresentation`对象|`rlDeterministicActorRepresentation`对象|`rlStochasticActorRepresentation`对象

`瓦尔`—可学习的参数值
单元阵列

`getLearnableParameterValues`现在是`getLearnableParameters`