对每个信道的所有观测结果分别进行归一化
批处理归一化操作将每个通道的所有观测数据独立地归一化。为了加快卷积神经网络的训练速度,降低对网络初始化的敏感性,在卷积和非线性运算之间采用批归一化雷
.
在归一化之后,操作通过可学习的偏移移动输入β并通过学习的比例因子来缩放它γ..
的batchnorm
函数将批标准化操作应用于dlarray
数据。使用dlarray
通过允许您标记尺寸,对象使高维数据更容易。例如,您可以使用使用的标记对应于空间,时间,频道和批处理尺寸的维度标记“年代”
,“T”
,'C'
, 和'B'
标签,分别。对于未指定的和其他维度,请使用“U”
标签。为了dlarray
通过特定尺寸运行的对象功能,可以通过格式化维度标签来指定维度标签dlarray
对象,或使用'datomformat'
选项。
请注意
在a内应用批量归一化分层图
对象或层
数组,使用BatchnormalizationLayer.
.
对输入数据应用批标准化操作海底
= Batchnorm(dlX
,抵消
,scaleFactor
)dlX
以及使用指定的偏移量和比例因子进行变换。
函数对“年代”
(空间),“T”
(时间),'B'
(批量),和“U”
(未指定的)尺寸dlX
中的每个通道'C'
(频道)尺寸独立。
对于未格式化的输入数据,请使用'datomformat'
选项。
[
还返回输入数据的群体平均值和方差海底
,popmu.
,popsigmasq.
] = Batchnorm(dlX
,抵消
,scaleFactor
)dlX
.
[
使用均值和方差应用批归一化操作海底
,updatedMu
,updatedsigmasq.
] = Batchnorm(dlX
,抵消
,scaleFactor
,亩
,sigmasq.
)亩
和sigmasq.
分别以及还返回更新的移动均值和方差统计。
使用此语法在培训期间维护均值和方差统计数据的运行值。使用最终更新值的平均值和方差以进行预测和分类。
批处理规范化操作将元素规范化x我首先计算平均值的输入μ.B和方差σ.B2在空间、时间和观测维度上分别为每个信道。然后,它将标准化激活计算为
在哪里ε.是一个常数,在方差很小时提高数值稳定性。
为了允许具有零均值和单位方差的输入的可能性对于跟随批量归一化的操作而不是最佳,批量归一化操作进一步换档并使用转换缩放激活
哪里偏移β和规模因素γ.是在网络训练过程中更新的可学习参数。
为了在训练后与网络进行预测,批量归一化需要固定的均值和方差以标准化数据。该固定均值和方差可以在训练后计算,或者在使用运行统计计算期间近似地估计。