rmspropupdate

使用均方根传播(RMSProp)更新参数

折叠所有页面

语法

[dlnet,averageSqGrad] = rmspropupdate(dlnet,grad,averageSqGrad)

[params,averageSqGrad] = rmspropupdate(params,grad,averageSqGrad)

［___= rmspropupdate(___learnRate sqGradDecay,ε)

描述

使用均方根传播(RMSProp)算法更新自定义训练循环中的网络可学习参数。

请注意

该函数应用RMSProp优化算法来更新自定义训练循环中的网络参数，该循环使用定义为的网络dlnetwork对象或模型函数。如果你想训练一个定义为a的网络层数组或作为LayerGraph，使用以下函数:

创建一个TrainingOptionsRMSProp对象使用trainingOptions函数。
使用TrainingOptionsRMSProp对象的trainNetwork函数。

例子

［dlnet，averageSqGrad= rmspropupdate(dlnet，研究生，averageSqGrad）更新网络的可学习参数dlnet使用RMSProp算法。在训练循环中使用此语法可迭代更新定义为的网络dlnetwork对象。

例子

［参数个数，averageSqGrad= rmspropupdate(参数个数，研究生，averageSqGrad）中更新可学习参数参数个数使用RMSProp算法。在训练循环中使用此语法迭代更新使用函数定义的网络的可学习参数。

例子

［___= rmspropupdate(___learnRate，sqGradDecay，ε）还指定除了前面语法中的输入参数外，用于全局学习率、平方梯度衰减和小常数epsilon的值。

例子

全部折叠

使用更新可学习参数`rmspropupdate`

执行一个全局学习率为的均方根传播更新步骤0.05的平方梯度衰减因子0.95．

将参数和参数梯度创建为数值数组。

Params = rand(3,3,4);Grad = ones(3,3,4);

初始化第一次迭代的平均梯度平方。

averageSqGrad = [];

指定全局学习率和平方梯度衰减因子的自定义值。

learnRate = 0.05;sqGradDecay = 0.95;

使用更新可学习参数rmspropupdate．

[params,averageSqGrad] = rmspropupdate(params,grad,averageSqGrad,learnRate,sqGradDecay);

训练网络`rmspropupdate`

打开实时脚本

使用rmspropupdate使用均方根传播(RMSProp)算法训练网络。

负荷训练数据

加载数字训练数据。

[XTrain,YTrain] = digitTrain4DArrayData;类=类别(YTrain);numClasses = nummel(类);

定义网络

属性定义网络体系结构并指定平均图像值“的意思是”选项在图像输入层。

图层= [imageInputLayer([28 28 1]，“名字”，“输入”，“的意思是”意味着(XTrain 4)) convolution2dLayer(5年,20年“名字”，“conv1”) reluLayer (“名字”，“relu1”20岁的)convolution2dLayer (3“填充”，1,“名字”，“conv2”) reluLayer (“名字”，“relu2”20岁的)convolution2dLayer (3“填充”，1,“名字”，“conv3”) reluLayer (“名字”，“relu3”) fullyConnectedLayer (numClasses“名字”，“俱乐部”) softmaxLayer (“名字”，“softmax”));lgraph = layerGraph(图层);

创建一个dlnetwork对象从图层图。

Dlnet = dlnetwork(lgraph);

定义模型梯度函数

创建helper函数modelGradients，在示例的末尾列出。函数的参数为dlnetwork对象dlnet和一小批输入数据dlX有相应的标签Y，并返回损失以及损失相对于中可学习参数的梯度dlnet．

指定培训项目

指定在培训期间使用的选项。

miniBatchSize = 128;numEpochs = 20;numObservations = numel(YTrain);numIterationsPerEpoch = floor(numObservations./miniBatchSize);

在GPU上训练(如果有的话)。使用GPU需要并行计算工具箱™和受支持的GPU设备。金宝app有关受支持设备的信息，请参见金宝appGPU支金宝app持版本(并行计算工具箱)．

executionEnvironment =“汽车”；

将训练过程可视化。

情节=“训练进步”；

列车网络的

使用自定义训练循环训练模型。对于每个纪元，洗牌数据并在小批量数据上循环。方法更新网络参数rmspropupdate函数。在每个纪元结束时，显示训练进度。

初始化培训进度图。

如果情节= =“训练进步”图lineLossTrain = animatedline(“颜色”，[0.85 0.325 0.098]);Ylim ([0 inf]) xlabel(“迭代”) ylabel (“损失”网格)在结束

初始化平均梯度的平方。

averageSqGrad = [];

培训网络。

迭代= 0;开始= tic;为epoch = 1:numEpochs% Shuffle数据。idx = randperm(数字(YTrain));XTrain = XTrain(:，:，:，idx);YTrain = YTrain(idx);为i = 1:numIterationsPerEpoch迭代=迭代+ 1;读取小批数据并将标签转换为虚拟标签%变量。idx = (i-1)*miniBatchSize+1:i*miniBatchSize;X = XTrain(:，:，:，idx);Y = 0 (numClasses, miniBatchSize，“单一”）;为Y(c,YTrain(idx)==classes(c)) = 1;结束将小批数据转换为大数组。dlX = dlarray(single(X))，“SSCB”）;如果在GPU上训练，则将数据转换为gpuArray。如果(executionEnvironment = =“汽车”&& canUseGPU) || executionEnvironment ==“图形”dlX = gpuArray(dlX);结束使用dlfeval和帮助函数。[gradients,loss] = dlfeval(@modelGradients,dlnet,dlX,Y);使用RMSProp优化器更新网络参数。[dlnet,averageSqGrad] = rmspropupdate(dlnet,gradients,averageSqGrad);%显示培训进度。如果情节= =“训练进步”D = duration(0,0,toc(start)，“格式”，“hh: mm: ss”）;addpoints (lineLossTrain、迭代、双(收集(extractdata(损失))))标题(”时代:“+ epoch +，消失:"+字符串(D))现在绘制结束结束结束

测试网络

通过比较测试集上的预测与真实标签来测试模型的分类准确性。

[XTest, YTest] = digitTest4DArrayData;

将数据转换为adlarray带尺寸格式“SSCB”．对于GPU预测，也将数据转换为agpuArray．

dlXTest = darray (XTest，“SSCB”）;如果(executionEnvironment = =“汽车”&& canUseGPU) || executionEnvironment ==“图形”dlXTest = gpuArray(dlXTest);结束

对图像进行分类dlnetwork对象时，使用预测计算并找出得分最高的课程。

dlYPred = predict(dlnet,dlXTest);[~，idx] = max(extractdata(dlYPred)，[]，1);YPred = classes(idx);

评估分类准确率。

accuracy = mean(YPred==YTest)

准确度= 0.9860

模型梯度函数

辅助函数modelGradients需要一个dlnetwork对象dlnet和一小批输入数据dlX有相应的标签Y,并返回的损失和梯度的损失相对于的可学习参数dlnet．要自动计算梯度，请使用dlgradient函数。

函数[gradients,loss] = modelGradients(dlnet,dlX,Y) dlYPred = forward(dlnet,dlX);loss = crossentropy(dlYPred,Y);gradients = dlgradient(loss,dlnet.Learnables);结束

输入参数

全部折叠

`dlnet`- - - - - -网络
`dlnetwork`对象

网络，指定为dlnetwork对象。

函数更新dlnet。可学的的属性dlnetwork对象。dlnet。可学的是一个包含三个变量的表:

层-层名，指定为字符串标量。
参数—参数名称，指定为字符串标量。
价值参数的值，指定为包含dlarray．

输入参数研究生一定是和?一样形式的表dlnet。可学的．

`参数个数`- - - - - -网络可学习参数
`dlarray`|数字数组|单元阵列|结构|表格

网络可学习参数，指定为dlarray、数字数组、单元格数组、结构体或表。

如果你指定参数个数作为一个表，它必须包含以下三个变量。

层-层名，指定为字符串标量。
参数—参数名称，指定为字符串标量。
价值参数的值，指定为包含dlarray．

你可以指定参数个数作为使用单元格数组、结构、表或嵌套单元格数组或结构的网络可学习参数的容器。单元格数组、结构或表中的可学习参数必须为dlarray或数据类型的数值双或单．

输入参数研究生必须提供与?完全相同的数据类型、顺序和字段(用于结构)或变量(用于表)参数个数．

数据类型:单|双|结构体|表格|细胞

`研究生`- - - - - -损失的梯度
`dlarray`|数字数组|单元阵列|结构|表格

损耗的梯度，指定为adlarray、数字数组、单元格数组、结构体或表。

确切的形式研究生取决于输入网络或可学习参数。下表显示了所需的格式研究生可能的输入rmspropupdate．

输入	可学的参数	梯度
`dlnet`	表格`dlnet。可学的`包含`层`，`参数`,`价值`变量。的`价值`变量由单元格数组组成，单元格数组包含每个可学习参数`dlarray`．	表具有相同的数据类型、变量和排序`dlnet。可学的`．`研究生`必须有一个`价值`由包含每个可学习参数梯度的单元格数组组成的变量。
`参数个数`	`dlarray`	`dlarray`使用相同的数据类型和顺序`参数个数`
	数字数组	具有相同数据类型和顺序的数值数组`参数个数`
	单元阵列	单元格数组，具有相同的数据类型、结构和顺序`参数个数`
	结构	结构，具有相同的数据类型、字段和排序`参数个数`
	表`层`，`参数`,`价值`变量。的`价值`变量必须由单元格数组组成，其中包含每个可学习参数`dlarray`．	表具有相同的数据类型、变量和排序`参数个数`．`研究生`必须有一个`价值`由包含每个可学习参数梯度的单元格数组组成的变量。

你可以获得研究生从电话到dlfeval对包含调用的函数求值dlgradient．有关更多信息，请参见在深度学习工具箱中使用自动区分．

`averageSqGrad`- - - - - -参数梯度平方的移动平均
`［］`|`dlarray`|数字数组|单元阵列|结构|表格

参数梯度平方的移动平均，指定为空数组，adlarray、数字数组、单元格数组、结构体或表。

确切的形式averageSqGrad取决于输入网络或可学习参数。下表显示了所需的格式averageSqGrad可能的输入rmspropupdate．

输入	可学的参数	平均梯度平方
`dlnet`	表格`dlnet。可学的`包含`层`，`参数`,`价值`变量。的`价值`变量由单元格数组组成，单元格数组包含每个可学习参数`dlarray`．	表具有相同的数据类型、变量和排序`dlnet。可学的`．`averageSqGrad`必须有一个`价值`由包含每个可学习参数的平均梯度平方的单元格数组组成的变量。
`参数个数`	`dlarray`	`dlarray`使用相同的数据类型和顺序`参数个数`
	数字数组	具有相同数据类型和顺序的数值数组`参数个数`
	单元阵列	单元格数组，具有相同的数据类型、结构和顺序`参数个数`
	结构	结构，具有相同的数据类型、字段和排序`参数个数`
	表`层`，`参数`,`价值`变量。的`价值`变量必须由单元格数组组成，其中包含每个可学习参数`dlarray`．	表具有相同的数据类型、变量和排序`参数个数`．`averageSqGrad`必须有一个`价值`由包含每个可学习参数的平均梯度平方的单元格数组组成的变量。

如果你指定averageSqGrad作为一个空数组，函数假设之前没有渐变，并以与一系列迭代中的第一次更新相同的方式运行。要迭代地更新可学习参数，请使用averageSqGrad的前一次调用的输出rmspropupdate随着averageSqGrad输入。

`learnRate`- - - - - -全球学习率
`0.001`(默认)|积极的标量

全局学习率，指定为正标量。的默认值learnRate是0.001．

如果指定网络参数为adlnetwork，每个参数的学习率为全局学习率乘以网络层中定义的相应学习率因子属性。

`sqGradDecay`- - - - - -平方梯度衰减因子
`0.9`(默认)|之间的正标量`0`而且`1`．

梯度衰减因子的平方，指定为之间的正标量0而且1．的默认值sqGradDecay是0.9．

`ε`- - - - - -小的常数
`1 e-8`(默认)|积极的标量

用于防止被零除错误的小常数，指定为正标量。的默认值ε是1 e-8．

输出参数

全部折叠

`dlnet`-更新网络
`dlnetwork`对象

网络，返回为adlnetwork对象。

函数更新dlnet。可学的的属性dlnetwork对象。

`参数个数`—更新网络可学习参数
`dlarray`|数字数组|单元数组|结构|表

更新网络可学习参数，返回为dlarray类型的数字数组、单元格数组、结构体或表价值变量，包含网络更新后的可学习参数。

`averageSqGrad`-更新了参数梯度平方的移动平均值
`dlarray`|数字数组|单元数组|结构|表

更新的参数梯度平方的移动平均值，返回为adlarray、数字数组、单元格数组、结构体或表。

兼容性的考虑

全部展开

`rmspropupdate`平方梯度衰减因子默认为`0.9`

R2020a的行为发生了变化

从R2020a开始，默认值的平方梯度衰减因子rmspropupdate是0.9．在以前的版本中，默认值为0.999．要重现前面的默认行为，请使用以下语法之一:

[dlnet,averageSqGrad] = rmspropupdate(dlnet,grad, 0.001,0.999) [params,averageSqGrad] = rmspropupdate(params,grad, 0.001,0.999)

扩展功能

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

使用注意事项和限制:

当以下输入参数中至少有一个是gpuArray或者一个dlarray类型的底层数据gpuArray，该函数运行在GPU上。
- 研究生
- averageSqGrad
- 参数个数

有关更多信息，请参见在图形处理器上运行MATLAB函数(并行计算工具箱)．

另请参阅

主题

R2019b引入

rmspropupdate

语法

描述

例子

使用更新可学习参数`rmspropupdate`

训练网络`rmspropupdate`

输入参数

`dlnet`- - - - - -网络
`dlnetwork`对象

`参数个数`- - - - - -网络可学习参数
`dlarray`|数字数组|单元阵列|结构|表格

`研究生`- - - - - -损失的梯度
`dlarray`|数字数组|单元阵列|结构|表格

`averageSqGrad`- - - - - -参数梯度平方的移动平均
`［］`|`dlarray`|数字数组|单元阵列|结构|表格

`learnRate`- - - - - -全球学习率
`0.001`(默认)|积极的标量

`sqGradDecay`- - - - - -平方梯度衰减因子
`0.9`(默认)|之间的正标量`0`而且`1`．

`ε`- - - - - -小的常数
`1 e-8`(默认)|积极的标量

输出参数

`dlnet`-更新网络
`dlnetwork`对象

`参数个数`—更新网络可学习参数
`dlarray`|数字数组|单元数组|结构|表

`averageSqGrad`-更新了参数梯度平方的移动平均值
`dlarray`|数字数组|单元数组|结构|表

更多关于

RMSProp

兼容性的考虑

`rmspropupdate`平方梯度衰减因子默认为`0.9`

扩展功能

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

另请参阅

主题

深度学习工具箱文档

金宝app

用MATLAB介绍深度学习

rmspropupdate

语法

描述

例子

使用更新可学习参数rmspropupdate

训练网络rmspropupdate

输入参数

dlnet- - - - - -网络dlnetwork对象

参数个数- - - - - -网络可学习参数dlarray|数字数组|单元阵列|结构|表格

研究生- - - - - -损失的梯度dlarray|数字数组|单元阵列|结构|表格

averageSqGrad- - - - - -参数梯度平方的移动平均［］|dlarray|数字数组|单元阵列|结构|表格

learnRate- - - - - -全球学习率0.001(默认)|积极的标量

sqGradDecay- - - - - -平方梯度衰减因子0.9(默认)|之间的正标量0而且1．

ε- - - - - -小的常数1 e-8(默认)|积极的标量

输出参数

dlnet-更新网络dlnetwork对象

参数个数—更新网络可学习参数dlarray|数字数组|单元数组|结构|表

averageSqGrad-更新了参数梯度平方的移动平均值dlarray|数字数组|单元数组|结构|表

更多关于

RMSProp

兼容性的考虑

rmspropupdate平方梯度衰减因子默认为0.9

扩展功能

GPU数组通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。

另请参阅

主题

深度学习工具箱文档

金宝app

用MATLAB介绍深度学习

使用更新可学习参数`rmspropupdate`

训练网络`rmspropupdate`

`dlnet`- - - - - -网络
`dlnetwork`对象

`参数个数`- - - - - -网络可学习参数
`dlarray`|数字数组|单元阵列|结构|表格

`研究生`- - - - - -损失的梯度
`dlarray`|数字数组|单元阵列|结构|表格

`averageSqGrad`- - - - - -参数梯度平方的移动平均
`［］`|`dlarray`|数字数组|单元阵列|结构|表格

`learnRate`- - - - - -全球学习率
`0.001`(默认)|积极的标量

`sqGradDecay`- - - - - -平方梯度衰减因子
`0.9`(默认)|之间的正标量`0`而且`1`．

`ε`- - - - - -小的常数
`1 e-8`(默认)|积极的标量

`dlnet`-更新网络
`dlnetwork`对象

`参数个数`—更新网络可学习参数
`dlarray`|数字数组|单元数组|结构|表

`averageSqGrad`-更新了参数梯度平方的移动平均值
`dlarray`|数字数组|单元数组|结构|表

`rmspropupdate`平方梯度衰减因子默认为`0.9`

GPU数组
通过使用并行计算工具箱™在图形处理单元(GPU)上运行来加速代码。