主要内容

rlOptimizer

优化器创建了一个对象,演员和批评

描述

优化器创建一个对象,更新一个演员的可学的参数或批评家在一个定制的培训循环

例子

algobj= rlOptimizer创建一个默认的优化器对象。您可以修改对象属性使用点符号。

例子

algobj= rlOptimizer (algOptions)优化器创建一个对象的属性指定的优化器选择对象algOptions

例子

全部折叠

使用rlOprimizer创建默认的优化算法对象使用训练的演员或批评家在一个定制的培训循环。

myAlg = rlOptimizer
myAlg = rlADAMOptimizer属性:GradientDecayFactor: 0.9000 SquaredGradientDecayFactor: 0.9990ε:1.0000 e-08 LearnRate: 0.0100 L2RegularizationFactor: 1.0000 e-04 GradientThreshold:正GradientThresholdMethod:“l2norm”

默认情况下,该函数返回一个rlADAMOptimizer对象的默认选项。可以使用点符号改变一些参数。

myAlg。LearnRate = 0.1;

您现在可以创建一个结构和设置它CriticOptimizerActorOptimizer字段myAlg。当你打电话runEpisode,通过结构作为输入参数。的runEpisode函数可以使用更新的方法myAlg更新你的演员或评论家可学的参数。

使用rlOprimizerOptions创建一个优化器选择对象。指定的算法“rmsprop”并设置学习速率0.2

myOptions = rlOptimizerOptions (算法=“rmsprop”,LearnRate = 0.2);

使用rlOptimizer创建一个对象使用优化算法训练的演员或批评家在一个定制的培训循环。指定优化器选项集myOptions作为输入参数。

myAlg = rlOptimizer (myOptions)
myAlg = rlRMSPropOptimizer属性:SquaredGradientDecayFactor: 0.9990ε:1.0000 e-08 LearnRate: 0.2000 L2RegularizationFactor: 1.0000 e-04 GradientThreshold:正GradientThresholdMethod:“l2norm”

这个函数返回一个rlRMSPropOptimizer对象的默认选项。可以使用点符号改变一些参数。

myAlg。GradientThreshold = 2;

您现在可以创建一个结构和设置它CriticOptimizerActorOptimizer字段myAlg。当你打电话runEpisode,通过结构作为输入参数。的runEpisode函数可以使用更新的方法myAlg更新你的演员或评论家可学的参数。

输入参数

全部折叠

算法的选择对象,指定为一个rlOptimizerOptions对象。

例子:rlOptimizerOptions(算法=“个”,LearnRate = 0.2)

输出参数

全部折叠

算法优化对象,作为一个返回rlADAMOptimizer,rlSGDMOptimizer,或rlRMSPropOptimizer对象。的runEpisode函数使用更新方法返回的对象更新的可学的参数一个演员或评论家。

版本历史

介绍了R2022a