groupNormalizationLayer

组归一化层

自从R2020b

展开全部页面

描述

分组归一层对每个观测数据在分组的通道子集上单独归一小批数据。为了加快卷积神经网络的训练并降低对网络初始化的敏感性，在卷积层和非线性层之间使用组归一化层，如ReLU层。

归一化后，该层用一个可学习的比例因子对输入进行缩放γ然后用一个可学习偏移量平移它β。

创建

语法

层= groupNormalizationLayer(numGroups)

层= groupNormalizationLayer(numGroups，名称，值)

描述

例子

层= groupNormalizationLayer (numGroups）创建一个组规范化层。

例子

层= groupNormalizationLayer (numGroups，名称,值）创建一个组规范化层，并设置可选ε，参数和初始化，学习率和正则化,名字使用一个或多个名称-值参数的属性。您可以指定多个名称-值参数。将每个属性名用引号括起来。

输入参数

全部展开

`numGroups`- - - - - -组数
正整数|`所有渠道的`|`“channel-wise”`

将输入数据的通道划分到的组数，指定为下列之一:

正整数—输入通道划分为指定数量的组。指定的组数必须与输入数据的通道数精确相除。
所有渠道的-将所有传入通道归为一个组。这个操作也称为层归一化。另外,使用layerNormalizationLayer。
“channel-wise”-将所有传入通道单独处理。此操作也称为实例规范化。另外,使用instanceNormalizationLayer。

属性

全部展开

集团标准化

`ε`- - - - - -添加到小批量方差的常数
`1 e-5`(默认)|积极的标量

添加到小批方差中的常数，指定为正标量。

该软件在归一化之前将这个常数添加到小批量方差中，以确保数值的稳定性并避免除零。

R2023a之前:ε必须大于等于1 e-5。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

`NumChannels`- - - - - -输入通道数
`“汽车”`(默认)|正整数

此属性是只读的。

输入通道的数量，指定为下列之一:

“汽车”-在训练时自动确定输入通道数。
正整数-为指定的输入通道数量配置层。NumChannels并且层中输入数据的通道数量必须匹配。例如，如果输入是RGB图像，则NumChannels一定是3。如果输入是带有16个滤波器的卷积层的输出，则NumChannels必须是16岁。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64|字符|字符串

参数和初始化

`ScaleInitializer`- - - - - -函数初始化通道比例因子
`“的”`(默认)|`“narrow-normal”`|函数处理

函数初始化通道比例因子，指定为以下之一:

“的”-用1初始化通道比例因子。
“零”-用零初始化通道比例因子。
“narrow-normal”-通过从均值为零、标准差为0.01的正态分布中独立采样，初始化通道尺度因子。
函数句柄——使用自定义函数初始化通道比例因子。如果指定了函数句柄，则该函数必须为Scale = func(sz),在那里深圳是秤的大小。有关示例，请参见指定自定义权重初始化函数。

层只初始化通道比例因子时规模属性为空。

数据类型:字符|字符串|function_handle

`OffsetInitializer`- - - - - -函数初始化通道偏移量
`“零”`(默认)|`“的”`|`“narrow-normal”`|函数处理

函数初始化通道偏移量，指定为以下之一:

“零”-用0初始化通道偏移量。
“的”-用1初始化通道偏移量。
“narrow-normal”-通过从均值为零、标准差为0.01的正态分布中独立采样，初始化通道偏移量。
函数句柄——使用自定义函数初始化通道偏移量。如果指定了函数句柄，则该函数必须为Offset = func(sz),在那里深圳是秤的大小。有关示例，请参见指定自定义权重初始化函数。

层只初始化通道偏移时抵消属性为空。

数据类型:字符|字符串|function_handle

`规模`- - - - - -渠道规模因子
`[]`(默认)|数字数组

渠道规模因子γ，指定为数值数组。

信道尺度因子是可学习的参数。当你训练一个网络使用trainNetwork函数或初始化dlnetwork对象,如果规模为非空，则软件使用规模属性作为初始值。如果规模为空，则软件使用ScaleInitializer。

的类型取决于层输入的类型trainNetwork，assembleNetwork，layerGraph,dlnetwork函数自动将此属性重新塑造为以下大小:

层的输入	财产大小
功能的输入	`NumChannels`1
矢量序列输入	`NumChannels`1
一维图像输入(因为R2023a)	1 -`NumChannels`
一维图像序列输入(因为R2023a)	1 -`NumChannels`
二维图像输入	1-by-1-by -`NumChannels`
二维图像序列输入	1-by-1-by -`NumChannels`
三维图像输入	1-by-1-by-1-by -`NumChannels`
三维图像序列输入	1-by-1-by-1-by -`NumChannels`

数据类型:单|双

`抵消`- - - - - -通道补偿
`[]`(默认)|数字数组

通道补偿β，指定为数值向量。

信道偏移量是可学习的参数。当你训练一个网络使用trainNetwork函数或初始化dlnetwork对象,如果抵消为非空，则软件使用抵消属性作为初始值。如果抵消为空，则软件使用OffsetInitializer。

的类型取决于层输入的类型trainNetwork，assembleNetwork，layerGraph,dlnetwork函数自动将此属性重新塑造为以下大小:

层的输入	财产大小
功能的输入	`NumChannels`1
矢量序列输入	`NumChannels`1
一维图像输入(因为R2023a)	1 -`NumChannels`
一维图像序列输入(因为R2023a)	1 -`NumChannels`
二维图像输入	1-by-1-by -`NumChannels`
二维图像序列输入	1-by-1-by -`NumChannels`
三维图像输入	1-by-1-by-1-by -`NumChannels`
三维图像序列输入	1-by-1-by-1-by -`NumChannels`

数据类型:单|双

学习率和正则化

`ScaleLearnRateFactor`- - - - - -学习率因子为尺度因子
`1`(默认)|负的标量

缩放因子的学习率因子，指定为非负标量。

该软件将该因子乘以全局学习率，以确定一层中尺度因子的学习率。例如，如果ScaleLearnRateFactor是2，则该层中尺度因子的学习率为当前全局学习率的两倍。属性指定的设置来确定全局学习率trainingOptions函数。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

`OffsetLearnRateFactor`- - - - - -偏移的学习率因子
`1`(默认)|负的标量

偏移量的学习率因子，指定为非负标量。

该软件将该因子乘以全局学习率，以确定一层中偏移量的学习率。例如，如果OffsetLearnRateFactor是2，则该层中偏移量的学习率为当前全局学习率的两倍。属性指定的设置来确定全局学习率trainingOptions函数。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

`ScaleL2Factor`- - - - - -l₂尺度因子的正则化因子
`1`(默认)|负的标量

l₂比例因子的正则化因子，指定为非负标量。

软件将这个因子乘以全局L₂正则化因子来确定一层中尺度因子的学习率。例如，如果ScaleL2Factor是2然后是L₂层中偏移量的正则化是全局L的两倍₂正则化因子。可以指定全局L₂正则化因子使用trainingOptions函数。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

`OffsetL2Factor`- - - - - -l₂偏移量的正则化因子
`1`(默认)|负的标量

l₂偏移量的正则化因子，指定为非负标量。

软件将这个因子乘以全局L₂正则化因子来确定一层中偏移量的学习率。例如，如果OffsetL2Factor是2然后是L₂层中偏移量的正则化是全局L的两倍₂正则化因子。可以指定全局L₂正则化因子使用trainingOptions函数。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

层

`名字`- - - - - -层的名字
`”`(默认)|特征向量|字符串标量

层名，指定为字符向量或字符串标量。为层数组输入时，trainNetwork，assembleNetwork，layerGraph,dlnetwork函数自动为具有该名称的层分配名称”。

数据类型:字符|字符串

`NumInputs`- - - - - -输入数量
`1`(默认)

此属性是只读的。

该层的输入数量。该层只接受单个输入。

数据类型:双

`InputNames`- - - - - -输入名字
`{"在"}`(默认)

此属性是只读的。

输入层的名称。该层只接受单个输入。

数据类型:细胞

`NumOutputs`- - - - - -输出数
`1`(默认)

此属性是只读的。

层的输出数量。这个图层只有一个输出。

数据类型:双

`OutputNames`- - - - - -输出的名字
`{“出”}`(默认)

此属性是只读的。

输出层的名称。这个图层只有一个输出。

数据类型:细胞

例子

全部折叠

创建组归一化层

打开实时脚本

创建一个组规范化层，用于规范化跨三组通道的传入数据。命名图层“groupnorm”。

层= groupNormalizationLayer(3，“名字”，“groupnorm”）

Name: 'groupnorm' NumChannels: 'auto'超参数NumGroups: 3 Epsilon: 1.0000 -05 Learnable Parameters偏移量:[]比例:[]显示所有属性

类中包含组规范化层层数组中。将传入的20个信道归一化，分为4组。

layers = [imageInputLayer([28 28 3]) convolution2dLayer(5,20) groupNormalizationLayer(4) reluLayer maxPooling2dLayer(2，“步”，2) fullyConnectedLayer(10) softmaxLayer classificationLayer]

2 "二维卷积20个5x5卷积，带stride[1 1]和填充[0 0 0 0 0]3 "组归一化组归一化4 " ReLU ReLU 5 "二维最大池化2x2最大池化，带stride[2 2]和填充[0 0 0 0 0]6 "全连接10全连接层7 " Softmax Softmax 8 "分类输出crossentropyex

算法

全部展开

组归一化层

分组规范化操作将元素规范化x_我首先计算平均值μ_G和方差σ_G²在空间，时间和分组子集的通道维度为每个观测独立。然后，计算归一化激活为

${\hat{x}}_{我} = \frac{x_{我} - μ_{G}}{\sqrt{σ_{G}^{2} + ε}} ，$

在哪里ϵ是在方差很小时提高数值稳定性的常数。为了考虑均值和单位方差为零的输入对于分组归一化之后的操作不是最优的可能性，分组归一化操作使用转换进一步转移和缩放激活

$y_{我} = γ {\hat{x}}_{我} + β ，$

其中偏移量β还有比例因子γ是在网络训练期间更新的可学习参数。

图层输入和输出格式

层数组或层图中的层将数据以格式化的方式传递给后续层dlarray对象。的格式dlarray对象是一个字符串，其中每个字符描述了数据的对应维度。格式由一个或多个字符组成:

“S”——空间
“C”——频道
“B”——批
“T”——时间
“U”——未指明的

例如，表示为4-D数组的2-D图像数据，其中前两个维度对应于图像的空间维度，第三个维度对应于图像的通道，第四个维度对应于批处理维度，可以被描述为具有格式“SSCB”(空间，空间，通道，批次)。

你可以与它们交互dlarray对象在自动区分工作流程中，如开发自定义层，使用functionLayer对象，或使用向前和预测功能与dlnetwork对象。

的支持输入格式金宝appGroupNormalizationLayer对象和相应的输出格式。类的自定义层，该自定义层不继承nnet.layer.Formattable类，或FunctionLayer对象的Formattable属性设置为0(false)，则该层接收一个未格式化的dlarray对象，其维度顺序对应于此表中的格式。

输入格式	输出格式
`“CB”`(通道、批处理)	`“CB”`(通道、批处理)
`“渣打银行”`(空间、通道、批次)	`“渣打银行”`(空间、通道、批次)
`“SSCB”`(空间、空间、通道、批次)	`“SSCB”`(空间、空间、通道、批次)
`“SSSCB”`(空间、空间、空间、通道、批次)	`“SSSCB”`(空间、空间、空间、通道、批次)
`“认知行为治疗”`(通道、批次、时间)	`“认知行为治疗”`(通道、批次、时间)
`“SCBT”`(空间、通道、批次、时间)	`“SCBT”`(空间、通道、批次、时间)
`“SSCBT”`(空间、空间、通道、批次、时间)	`“SSCBT”`(空间、空间、通道、批次、时间)
`“SSSCBT”`(空间、空间、空间、通道、批次、时间)	`“SSSCBT”`(空间、空间、空间、通道、批次、时间)
`“铜”`(未指明的通道)	`“铜”`(未指明的通道)
`“SC”`(空间、通道)	`“SC”`(空间、通道)
`“SSC”`(空间，空间，通道)	`“SSC”`(空间，空间，通道)
`“SSSC”`(空间，空间，空间，通道)	`“SSSC”`(空间，空间，空间，通道)

在dlnetwork对象,GroupNormalizationLayer对象还支持这些输入和输出格金宝app式组合。

输入格式	输出格式
`“CT”`(通道、时间)	`“CT”`(通道、时间)
`“SCT”`(空间、渠道、时间)	`“SCT”`(空间、渠道、时间)
`“SSCT”`(空间、空间、通道、时间)	`“SSCT”`(空间、空间、通道、时间)
`“SSSCT”`(空间，空间，空间，通道，时间)	`“SSSCT”`(空间，空间，空间，通道，时间)

参考文献

[1]吴宇欣，何开明。“组织正常化。”预印本已于2018年6月11日提交。https://arxiv.org/abs/1803.08494。

扩展功能

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU代码生成
使用GPU Coder™为NVIDIA®GPU生成CUDA®代码。

版本历史

R2020b中介绍

全部展开

R2023a:`ε`金宝app支持小于`1 e-5`

的ε选项还支持小于的正值金宝app1 e-5。

R2023a:层支持1-D金宝app图像序列数据

GroupNormalizationLayer对象支持规范化一金宝app维图像序列数据(一个空间维度和一个时间维度的数据)。

另请参阅

groupNormalizationLayer

描述

创建

语法

描述

输入参数

numGroups- - - - - -组数正整数|所有渠道的|“channel-wise”

属性

集团标准化

ε- - - - - -添加到小批量方差的常数1 e-5(默认)|积极的标量

NumChannels- - - - - -输入通道数“汽车”(默认)|正整数

参数和初始化

ScaleInitializer- - - - - -函数初始化通道比例因子“的”(默认)|“narrow-normal”|函数处理

OffsetInitializer- - - - - -函数初始化通道偏移量“零”(默认)|“的”|“narrow-normal”|函数处理

规模- - - - - -渠道规模因子[](默认)|数字数组

抵消- - - - - -通道补偿[](默认)|数字数组

学习率和正则化

ScaleLearnRateFactor- - - - - -学习率因子为尺度因子1(默认)|负的标量

OffsetLearnRateFactor- - - - - -偏移的学习率因子1(默认)|负的标量

ScaleL2Factor- - - - - -l2尺度因子的正则化因子1(默认)|负的标量

OffsetL2Factor- - - - - -l2偏移量的正则化因子1(默认)|负的标量

层

名字- - - - - -层的名字”(默认)|特征向量|字符串标量

NumInputs- - - - - -输入数量1(默认)

InputNames- - - - - -输入名字{"在"}(默认)

NumOutputs- - - - - -输出数1(默认)

OutputNames- - - - - -输出的名字{“出”}(默认)

例子

创建组归一化层

更多关于

组归一化层

算法

组归一化层

图层输入和输出格式

参考文献

扩展功能

C/ c++代码生成使用MATLAB®Coder™生成C和c++代码。

GPU代码生成使用GPU Coder™为NVIDIA®GPU生成CUDA®代码。

版本历史

R2023a:ε金宝app支持小于1 e-5

R2023a:层支持1-D金宝app图像序列数据

另请参阅

主题

`numGroups`- - - - - -组数
正整数|`所有渠道的`|`“channel-wise”`

`ε`- - - - - -添加到小批量方差的常数
`1 e-5`(默认)|积极的标量

`NumChannels`- - - - - -输入通道数
`“汽车”`(默认)|正整数

`ScaleInitializer`- - - - - -函数初始化通道比例因子
`“的”`(默认)|`“narrow-normal”`|函数处理

`OffsetInitializer`- - - - - -函数初始化通道偏移量
`“零”`(默认)|`“的”`|`“narrow-normal”`|函数处理

`规模`- - - - - -渠道规模因子
`[]`(默认)|数字数组

`抵消`- - - - - -通道补偿
`[]`(默认)|数字数组

`ScaleLearnRateFactor`- - - - - -学习率因子为尺度因子
`1`(默认)|负的标量

`OffsetLearnRateFactor`- - - - - -偏移的学习率因子
`1`(默认)|负的标量

`ScaleL2Factor`- - - - - -l₂尺度因子的正则化因子
`1`(默认)|负的标量

`OffsetL2Factor`- - - - - -l₂偏移量的正则化因子
`1`(默认)|负的标量

`名字`- - - - - -层的名字
`”`(默认)|特征向量|字符串标量

`NumInputs`- - - - - -输入数量
`1`(默认)

`InputNames`- - - - - -输入名字
`{"在"}`(默认)

`NumOutputs`- - - - - -输出数
`1`(默认)

`OutputNames`- - - - - -输出的名字
`{“出”}`(默认)

C/ c++代码生成
使用MATLAB®Coder™生成C和c++代码。

GPU代码生成
使用GPU Coder™为NVIDIA®GPU生成CUDA®代码。

R2023a:`ε`金宝app支持小于`1 e-5`