主要内容

图像输入层

图像输入层

描述

图像输入层将二维图像输入到网络并应用数据规范化。

对于三维图像输入,使用image3dInputLayer

创造

描述

=图像输入层(输入大小返回图像输入层并指定输入大小财产。

例子

=图像输入层(输入大小名称,值设置可选的性质使用名称-值对。可以指定多个名称-值对。将每个属性名称用单引号括起来。

性质

全部展开

图像输入

输入数据的大小,指定为整数的行向量[w c h]哪里hw,c分别对应通道的高度、宽度和数量。

  • 对于灰度图像,指定一个向量c等于1

  • 对于RGB图像,指定一个向量c等于3.

  • 对于多光谱或高光谱图像,请使用c等于通道数。

对于三维图像或体积输入,使用image3dInputLayer

例子:[224 224 3]

每次数据通过输入层向前传播时应用的数据规范化,指定为以下选项之一:

  • “零中心”-减去指定的平均值意思是

  • “zscore”-减去指定的平均值意思是除以StandardDeviation

  • “rescale-symmetric”—使用指定的最小值和最大值重新缩放输入,使其在[- 1,1]范围内分钟马克斯,分别。

  • “重新缩放01”-使用指定的最小值和最大值将输入重新缩放到[0,1]范围内分钟马克斯,分别。

  • “没有”-不要规范化输入数据。

  • function handle—使用指定的函数对数据进行规范化。功能必须是形式的Y = func (X)哪里X是输入数据和输出数据Y是标准化数据。

提示

默认情况下,软件会在培训时自动计算规范化统计信息。要在培训时节省时间,请指定规范化所需的统计信息并设置“ResetInputNormalization”选项培训选项

规格化维度,指定为以下之一:

  • “汽车”—如果培训选项是您可以指定任何规格化统计信息(意思是StandardDeviation分钟马克斯),然后对与统计信息匹配的维度进行规格化。否则,在训练时重新计算统计信息,并应用通道规格化。

  • “频道”——Channel-wise正常化。

  • “元素”——Element-wise正常化。

  • “所有”-使用标量统计使所有值归一化。

零中心和z分数标准化的平均值,指定为ah-借-w-借-c数组,1-by-1-by -c每个通道的方法数组、数字标量或[]哪里hw,c分别对应于平均值的高度、宽度和通道数量。

如果指定意思是那么财产呢归一化必须“零中心”“zscore”如果意思是[],然后软件计算训练时的平均值。

您可以在不进行培训的情况下创建网络时设置此属性(例如,使用装配网络).

数据类型:仅有一个的|双重的|int8|int16|int32|int64|uint8|uint16|uint32|uint64

z分数标准化的标准偏差,指定为h-借-w-借-c数组,1-by-1-by -c每个通道的方法数组、数字标量或[]哪里hw,c分别对应高度、宽度和通道数的标准差。

如果指定StandardDeviation那么财产呢归一化必须“zscore”如果StandardDeviation[],然后软件计算训练时的标准差。

您可以在不进行培训的情况下创建网络时设置此属性(例如,使用装配网络).

数据类型:仅有一个的|双重的|int8|int16|int32|int64|uint8|uint16|uint32|uint64

重新缩放的最小值,指定为h-借-w-借-c数组,1-by-1-by -c每个通道的最小值数组、数值标量或[]哪里hw,c分别对应于最小值的高度、宽度和通道数量。

如果指定分钟那么财产呢归一化必须“rescale-symmetric”“重新缩放01”如果分钟[],然后软件计算训练时的最小值。

您可以在不进行培训的情况下创建网络时设置此属性(例如,使用装配网络).

数据类型:仅有一个的|双重的|int8|int16|int32|int64|uint8|uint16|uint32|uint64

重新缩放的最大值,指定为h-借-w-借-c数组,1-by-1-by -c每个通道的最大值数组、数值标量或[]哪里hw,c分别对应最大值的高度、宽度和通道数。

如果指定马克斯那么财产呢归一化必须“rescale-symmetric”“重新缩放01”如果马克斯[],然后软件计算在训练时的最大值。

您可以在不进行培训的情况下创建网络时设置此属性(例如,使用装配网络).

数据类型:仅有一个的|双重的|int8|int16|int32|int64|uint8|uint16|uint32|uint64

请注意

数据扩充属性。若要使用裁剪、反射和其他几何变换预处理图像,请使用增强图像数据存储代替。

在培训期间使用的数据扩充转换,指定为以下内容之一。

  • “没有”—无数据增强

  • “randcrop”-从训练图像中随机裁剪。随机裁剪的大小与输入大小相同。

  • “randfliplr”-以50%的几率水平随机翻转输入图像。

  • 单元阵列的“randcrop”“randfliplr”.软件按照单元格数组中指定的顺序应用扩展。

图像数据的增强是减少过拟合的另一种方法[1][2]

数据类型:一串|烧焦|细胞

层名称,指定为字符向量或字符串标量。若要在层图中包含层,必须指定非空且唯一的层名称。如果使用层和名称设置为,然后软件在训练时自动为该层分配一个名称。

数据类型:烧焦|一串

层的输入数。该层没有输入。

数据类型:双重的

输入图层的名称。该图层没有输入。

数据类型:细胞

层输出的数量。这一层只有一个输出。

数据类型:双重的

输出图层的名称。该层只有一个输出。

数据类型:细胞

例子

全部折叠

创建一个带有名称的28 × 28色图像输入层“输入”.默认情况下,该层通过从每个输入图像中减去训练集的平均图像来执行数据归一化。

inputlayer = imageInputLayer([28 28 3],“名字”“输入”
inputlayer=ImageInputLayer,具有以下属性:名称:'input'InputSize:[28 28 3]超参数数据增强:'none'规范化:'zerocenter'规范化维度:'auto'平均值:[]

包含一个图像输入层数组中。

层=[...imageInputLayer([28 28 1])卷积2dlayer (5,20) reluLayer maxPooling2dLayer(2, 20)“步”,2) fulllyconnectedlayer (10) softmaxLayer classifier]
layers=7x1层阵列,带层:1''图像输入28x28x1图像,带“零中心”规格化2''卷积20 5x5卷积,带跨步[1]和填充[0 0 0 0 0 0 0]3''ReLU ReLU 4''最大池2x2最大池,带跨步[2]和填充[0 0 0 0 0 0]5''全连接10''全连接层6''Softmax Softmax 7''分类输出crossentropyex

兼容性的考虑

全部展开

不建议在R2019b中启动

未来版本中的行为更改

工具书类

[1] Krizhevsky,A.,I.Sutskever和G.E.Hinton,“深卷积神经网络的图像网络分类”。神经信息处理系统的进展2012年第25卷。

[2] Cireşan,D.,U.Meier,J.Schmidhuber.“用于图像分类的多列深度神经网络”。计算机视觉与模式识别会议, 2012.

扩展能力

介绍了R2016a