定义Ornstein-Uhlenbeck (OU)噪声模型概率分布的属性被重新命名。TD3 agent使用OU噪声进行探测。
这个方差
属性已重命名StandardDeviation
.
这个VarianceDecayRate
属性已重命名StandardDeviationDecayRate
.
这个VarianceMin
属性已重命名StandardDeviationMin
.
这些属性的默认值保持不变。当一个OrnsteinUhlenbeckActionNoise
从以前的MATLAB版本中保存的噪声对象被加载,的值方差
,VarianceDecayRate
,VarianceMin
复制在StandardDeviation
,StandardDeviationDecayRate
,StandardDeviationMin
分别地
这个方差
,VarianceDecayRate
,VarianceMin
属性仍然有效,但不建议使用。要定义OU噪波模型的概率分布,请改用新的属性名称。
更新代码
这个表显示了如何更新代码以使用新的属性名rlTD3AgentOptions
对象td3opt
.
不推荐 |
推荐 |
td3opt.ExplorationModel.Variance=0.5;
|
td3opt.ExplorationModel。StandardDeviation= sqrt(0.5);
|
td3opt.ExplorationModel.VarianceDecayRate=0.1;
|
td3opt.ExplorationModel。StandardDeviationDecayRate = 0.1;
|
td3opt.ExplorationModel。VarianceMin = 0.1;
|
td3opt.ExplorationModel。StandardDeviationMin= sqrt(0.1);
|
td3opt.TargetPolicySmoothModel。方差= 0.5;
|
td3opt.TargetPolicySmoothModel.StandardDeviation=sqrt(0.5);
|
td3opt.TargetPolicySmoothModel。VarianceDecayRate = 0.1;
|
td3opt.TargetPolicySmoothModel.StandardDecyRate=0.1;
|
td3opt.TargetPolicySmoothModel.VarianceMin=0.1;
|
td3opt.TargetPolicySmoothModel。StandardDeviationMin= sqrt(0.1);
|