文档帮助中心文档
setLearnableParameterValues
setLearnableParameters
设置策略或值函数表示的可学习参数值
newRep = setLearnableParameters (oldRep val)
例子
newRep= setLearnableParameters (oldRep,瓦尔)返回一个新的策略或值函数表示,newRep,其结构与原始表示法相同,oldRep的可学习参数值瓦尔.
newRep= setLearnableParameters (oldRep,瓦尔)
newRep
oldRep
瓦尔
全部折叠
假设您有一个现有的经过训练的强化学习代理。对于本例,从中加载经过训练的代理训练DDPG代理控制双集成商系统.
负载(“DoubleIntegDDPG.mat”,“代理”)
从代理获取评论家表示。
评论家= getCritic(代理);
从批评家那里获得可学习参数。
params = getLearnableParameters(批评);
修改参数值。对于本例,只需将所有参数乘以2.
2
modifiedParams = cellfun(@(x) x*2,params,“UniformOutput”、假);
将critical的参数值设置为修改后的新值。
评论家= setLearnableParameters(评论家,modifiedParams);
将代理中的评论家设置为新修改的评论家。
代理= setCritic(代理、批评);
从代理获取参与者表示。
演员= getActor(代理);
从行动者处获得可学习参数。
params = getLearnableParameters(演员);
将参与者的参数值设置为新的修改值。
演员= setLearnableParameters(演员,modifiedParams);
将代理中的参与者设置为新修改的参与者。
代理= setActor(代理、演员);
rlValueRepresentation
rlQValueRepresentation
rlDeterministicActorRepresentation
rlStochasticActorRepresentation
保单或价值函数的原始表示,指定为下列之一:
rlValueRepresentation对象-值函数表示
rlQValueRepresentation对象- q值函数表示
rlDeterministicActorRepresentation对象-具有确定性动作的参与者表示
rlStochasticActorRepresentation对象-带有随机动作的参与者表示
要创建策略或值函数表示,请使用以下方法之一:
使用相应的表示对象创建表示。
使用getCritic
getCritic
使用getActor.
getActor
表示对象的可学习参数值,指定为单元格数组。的参数瓦尔必须与结构和参数化兼容吗oldRep.
要从现有表示形式获得可学习参数值的单元格数组,然后可以对其进行修改,请使用getLearnableParameters函数。
getLearnableParameters
作为相同类型的表示对象返回的新策略或值函数表示oldRep.newRep有相同的结构oldRep但参数值来自瓦尔.
全部展开
R2020a行为改变
setLearnableParameterValues现在是setLearnableParameters.要更新代码,请将函数名改为setLearnableParameterValues来setLearnableParameters.语法是等价的。
getActor|getCritic|getLearnableParameters|setActor|setCritic
setActor
setCritic
您有这个示例的一个修改版本。要用编辑打开这个例子吗?
您点击了一个对应于这个MATLAB命令的链接:
通过在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
选择一个网站来获得可用的翻译内容,并看到当地的活动和提供。根据您所在的位置,我们建议您选择:.
你也可以从以下列表中选择一个网站:
请选择表现最佳的中国网站(中文或英文)。MathWorks的其他国家网站并没有针对您所在位置的访问进行优化。
与当地办事处联系