文档帮助中心文档
getLearnableParameterValues
getLearnableParameters
从策略或值函数表示中获取可学习的参数值
val = getLearnableParameters(代表)
例子
瓦尔= getLearnableParameters (代表)从强化学习策略或值函数表示形式返回可学习参数的值代表.
瓦尔= getLearnableParameters (代表)
瓦尔
代表
全部折叠
假设您有一个现有的经过训练的强化学习代理。对于本例,从下面加载经过训练的代理培训DDPG Agent控制双积分系统.
负载(“DoubleIntegDDPG.mat”,“代理”)
从代理获取批评家表示。
评论家= getCritic(代理);
从评论家那里获取可学习的参数。
params = getLearnableParameters(批评);
修改参数值。对于本例,只需将所有参数乘以2.
2
@(x) x*2,“UniformOutput”、假);
将批评家的参数值设置为修改后的值。
评论家= setLearnableParameters(评论家,modifiedParams);
将代理中的评论家设置为新的修改过的评论家。
代理= setCritic(代理、批评);
从代理获取参与者表示。
演员= getActor(代理);
从参与者那里获得可学习的参数。
params = getLearnableParameters(演员);
将参与者的参数值设置为新的修改值。
演员= setLearnableParameters(演员,modifiedParams);
将代理中的参与者设置为新修改的参与者。
代理= setActor(代理、演员);
rlValueRepresentation
rlQValueRepresentation
rlDeterministicActorRepresentation
rlStochasticActorRepresentation
策略或值函数表示,指定为下列之一:
rlValueRepresentation对象-值函数表示
rlQValueRepresentation对象- q值函数表示
rlDeterministicActorRepresentationobject -具有确定性动作的Actor表示
rlStochasticActorRepresentation随机动作的对象-行动者表示
要创建策略或值函数表示,请使用以下方法之一:
使用相应的表示对象创建表示。
使用。从代理获取现有值函数表示getCritic
getCritic
使用。从代理获取现有策略表示getActor.
getActor
表示对象的可学习参数值,作为单元格数组返回。属性在原始代理或不同的代理中修改这些参数值并设置它们setLearnableParameters函数。
setLearnableParameters
全部展开
行为在R2020a中改变
getLearnableParameterValues现在是getLearnableParameters.要更新代码,请更改函数名getLearnableParameterValues来getLearnableParameters.语法是等价的。
setLearnableParameters|getActor|getCritic|setActor|setCritic
setActor
setCritic
您有这个示例的修改版本。您想打开这个示例与您的编辑吗?
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。
与当地办事处联系