setLearnableParameters

设置策略或值函数表示的可学习参数值

全部折叠到页面中

语法

newRep = setLearnableParameters (oldRep val)

描述

例子

newRep= setLearnableParameters (oldRep，瓦尔）返回一个新的策略或值函数表示，newRep，其结构与原始表示法相同，oldRep的可学习参数值瓦尔．

例子

全部折叠

修改紧急参数值

打开生活的脚本

假设您有一个现有的经过训练的强化学习代理。对于本例，从中加载经过训练的代理训练DDPG代理控制双集成商系统．

负载(“DoubleIntegDDPG.mat”，“代理”）

从代理获取评论家表示。

评论家= getCritic(代理);

从批评家那里获得可学习参数。

params = getLearnableParameters(批评);

修改参数值。对于本例，只需将所有参数乘以2．

modifiedParams = cellfun(@(x) x*2,params，“UniformOutput”、假);

将critical的参数值设置为修改后的新值。

评论家= setLearnableParameters(评论家,modifiedParams);

将代理中的评论家设置为新修改的评论家。

代理= setCritic(代理、批评);

修改角色参数值

打开生活的脚本

假设您有一个现有的经过训练的强化学习代理。对于本例，从中加载经过训练的代理训练DDPG代理控制双集成商系统．

负载(“DoubleIntegDDPG.mat”，“代理”）

从代理获取参与者表示。

演员= getActor(代理);

从行动者处获得可学习参数。

params = getLearnableParameters(演员);

修改参数值。对于本例，只需将所有参数乘以2．

modifiedParams = cellfun(@(x) x*2,params，“UniformOutput”、假);

将参与者的参数值设置为新的修改值。

演员= setLearnableParameters(演员,modifiedParams);

将代理中的参与者设置为新修改的参与者。

代理= setActor(代理、演员);

输入参数

全部折叠

`oldRep`- - - - - -原始的策略或值函数表示
`rlValueRepresentation`对象|`rlQValueRepresentation`对象|`rlDeterministicActorRepresentation`对象|`rlStochasticActorRepresentation`对象

保单或价值函数的原始表示，指定为下列之一:

rlValueRepresentation对象-值函数表示
rlQValueRepresentation对象- q值函数表示
rlDeterministicActorRepresentation对象-具有确定性动作的参与者表示
rlStochasticActorRepresentation对象-带有随机动作的参与者表示

要创建策略或值函数表示，请使用以下方法之一:

使用相应的表示对象创建表示。
使用getCritic
使用getActor．

`瓦尔`- - - - - -可学的参数值
单元阵列

表示对象的可学习参数值，指定为单元格数组。的参数瓦尔必须与结构和参数化兼容吗oldRep．

要从现有表示形式获得可学习参数值的单元格数组，然后可以对其进行修改，请使用getLearnableParameters函数。

输出参数

全部折叠

`newRep`-新的策略或值函数表示
`rlValueRepresentation`|`rlQValueRepresentation`|`rlDeterministicActorRepresentation`|`rlStochasticActorRepresentation`

作为相同类型的表示对象返回的新策略或值函数表示oldRep．newRep有相同的结构oldRep但参数值来自瓦尔．

兼容性的考虑

全部展开

`setLearnableParameterValues`现在是`setLearnableParameters`

R2020a行为改变

setLearnableParameterValues现在是setLearnableParameters．要更新代码，请将函数名改为setLearnableParameterValues来setLearnableParameters．语法是等价的。

另请参阅

getActor|getCritic|getLearnableParameters|setActor|setCritic

主题

介绍了R2019a

强化学习工具箱文档

金宝app

用MATLAB和Simulink强化学习金宝app

下载电子书

setLearnableParameters

语法

描述

例子

修改紧急参数值

修改角色参数值

输入参数

oldRep- - - - - -原始的策略或值函数表示rlValueRepresentation对象|rlQValueRepresentation对象|rlDeterministicActorRepresentation对象|rlStochasticActorRepresentation对象

瓦尔- - - - - -可学的参数值单元阵列

输出参数

newRep-新的策略或值函数表示rlValueRepresentation|rlQValueRepresentation|rlDeterministicActorRepresentation|rlStochasticActorRepresentation

兼容性的考虑

setLearnableParameterValues现在是setLearnableParameters

另请参阅

主题

强化学习工具箱文档

金宝app

用MATLAB和Simulink强化学习金宝app

`oldRep`- - - - - -原始的策略或值函数表示
`rlValueRepresentation`对象|`rlQValueRepresentation`对象|`rlDeterministicActorRepresentation`对象|`rlStochasticActorRepresentation`对象

`瓦尔`- - - - - -可学的参数值
单元阵列

`newRep`-新的策略或值函数表示
`rlValueRepresentation`|`rlQValueRepresentation`|`rlDeterministicActorRepresentation`|`rlStochasticActorRepresentation`

`setLearnableParameterValues`现在是`setLearnableParameters`