主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

imageInputLayer

説明

イメージ入力層は,ネットワークに2次元イメージを入力し,データ正規化を適用します。

3次元イメージ入力の場合,image3dInputLayerを使用します。

作成

説明

= imageInputLayer (inputSizeはイメージ入力層を返し,InputSizeプロパティを指定します。

= imageInputLayer (inputSize名称,值は,名前と値のペアを使用して,オプションのプロパティを設定します。複数の名前と値のペアを指定できます。各プロパティ名を一重引用符で囲みます。

プロパティ

すべて展開する

イメージ入力

入力データのサイズ。整数の行ベクトル[w c h]として指定します。ここで,hw,およびc幅,はそれぞれ高さおよびチャネル数に対応します。

  • グレースケールイメージの場合,c1に等しいベクトルを指定します。

  • RGBイメージの場合,c3.に等しいベクトルを指定します。

  • マルチスペクトルイメージまたはハイパースペクトルイメージの場合,cがチャネル数に等しいベクトルを指定します。

3次元イメージ入力またはボリューム入力の場合,image3dInputLayerを使用します。

例:(224 224)

データが入力層を通じて順伝播されるたびに適用するデータ正規化。次のいずれかに指定します。

  • “zerocenter”- - - - - -的意思是によって指定された平均を減算します。

  • “zscore”- - - - - -的意思是によって指定された平均を減算し,StandardDeviationで除算します。

  • “rescale-symmetric”- - - - - -最小值および马克斯によってそれぞれ指定された最小値と最大値を使用して,範囲[1]に入力を再スケーリングします。

  • “rescale-zero-one”- - - - - -最小值および马克斯によってそれぞれ指定された最小値と最大値を使用して,範囲[0,1]に入力を再スケーリングします。

  • “没有”——入力データを正規化しません。

  • 関数ハンドル——指定した関数を使用してデータを正規化します。関数は,Y = func (X)という形式でなければなりません。ここで,Xは入力データ,出的力Yは正規化データです。

ヒント

既定では,学習時に正規化統計量が自動的に計算されます。学習時に時間を節約するため,正規化に必要な統計量を指定し,trainingOptions“ResetInputNormalization”オプションをに設定します。

正規化の次元。次のいずれかに指定します。

  • “汽车”——学習オプションがの場合,いずれかの正規化統計量(的意思是StandardDeviation最小值,または马克斯)を指定し,統計量に一致する次元に対して正規化を行います。そうでない場合,学習時に統計量を再計算し,チャネル単位の正規化を適用します。

  • “通道”——チャネル単位の正規化。

  • “元素”——要素単位の正規化。

  • “所有”——スカラーの統計量を使用してすべての値を正規化します。

ゼロ中心正規化およびzスコア正規化の平均。hx w x c の配列、チャネルごとの平均から成る 1 x 1 x c の配列、数値スカラー、または[]として指定します。ここで,h、w,およびcはそれぞれ平均の高さ、幅、およびチャネル数に対応します。

的意思是プロパティを指定する場合,归一化“zerocenter”または“zscore”でなければなりません。的意思是[]の場合,学習時に平均が計算されます。

学習を行わずにネットワークを作成する場合(assembleNetworkを使用してネットワークを組み立てる場合など),このプロパティを設定できます。

データ型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

zスコア正規化の標準偏差。hx w x c の配列、チャネルごとの平均から成る 1 x 1 x c の配列、数値スカラー、または[]として指定します。ここで,h、w,およびcはそれぞれ標準偏差の高さ、幅、およびチャネル数に対応します。

StandardDeviationプロパティを指定する場合,归一化“zscore”でなければなりません。StandardDeviation[]の場合,学習時に標準偏差が計算されます。

学習を行わずにネットワークを作成する場合(assembleNetworkを使用してネットワークを組み立てる場合など),このプロパティを設定できます。

データ型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

再スケーリングの最小値。hx w x c の配列、チャネルごとの最小値から成る 1 x 1 x c の配列、数値スカラー、または[]として指定します。ここで,h、w,およびcはそれぞれ最小値の高さ、幅、およびチャネル数に対応します。

最小值プロパティを指定する場合,归一化“rescale-symmetric”または“rescale-zero-one”でなければなりません。最小值[]の場合,学習時に最小値が計算されます。

学習を行わずにネットワークを作成する場合(assembleNetworkを使用してネットワークを組み立てる場合など),このプロパティを設定できます。

データ型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

再スケーリングの最大値。hx w x c の配列、チャネルごとの最大値から成る 1 x 1 x c の配列、数値スカラー、または[]として指定します。ここで,h、w,およびcはそれぞれ最大値の高さ、幅、およびチャネル数に対応します。

马克斯プロパティを指定する場合,归一化“rescale-symmetric”または“rescale-zero-one”でなければなりません。马克斯[]の場合,学習時に最大値が計算されます。

学習を行わずにネットワークを作成する場合(assembleNetworkを使用してネットワークを組み立てる場合など),このプロパティを設定できます。

データ型:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

メモ

DataAugmentationプロパティは推奨されません。トリミング,反転,およびその他の幾何変換によってイメージを前処理するには,代わりにaugmentedImageDatastoreを使用します。

学習時に使用するデータ拡張変換。次のいずれかに指定します。

  • “没有”——データ拡張を行いません。

  • “randcrop”——学習イメージからランダムにトリミングします。ランダムなトリミングのサイズは,入力のサイズと同じです。

  • “randfliplr”- 50%の確率で入力イメージを水平方向にランダムに反転させます。

  • “randcrop”および“randfliplr”の细胞配列。细胞配列で指定された順序で拡張が適用されます。

イメージデータの拡張は,過適合を防ぐ方法の1つです[1][2]

データ型:字符串|字符|细胞

層の名前。文字ベクトルまたは字符串スカラーとして指定します。層グラフに層を含めるには、空ではない一意の層の名前を指定しなければなりません。この層が含まれる系列ネットワークに学習させて的名字に設定すると,学習時に層に名前が自動的に割り当てられます。

データ型:字符|字符串

層の入力の数。この層には入力がありません。

データ型:

層の入力名。この層には入力がありません。

データ型:细胞

層の出力の数。この層には単一の出力のみがあります。

データ型:

層の出力名。この層には単一の出力のみがあります。

データ型:细胞

すべて折りたたむ

“输入”。という名前で28 x 28のカラーイメージのイメージ入力層を作成します。既定では,すべての入力イメージから学習セットの平均イメージを減算することで,層でデータ正規化が実行されます。

inputlayer = imageInputLayer([28 28 3],“名字”“输入”
inputlayer = ImageInputLayer with properties: Name: 'input' InputSize: [28 28 3] Hyperparameters dataugmentation: 'none' NormalizationDimension: 'auto' Mean: []

配列にイメージ入力層を含めます。

层= [...imageInputLayer([28 28 1])卷积2dlayer (5,20) reluLayer maxPooling2dLayer(2, 20)“步”,2) fulllyconnectedlayer (10) softmaxLayer classifier]
图层数组:1”的形象输入28 x28x1图像zerocenter正常化2”卷积20 5 x5旋转步[1]和填充[0 0 0 0]3”ReLU ReLU 4”马克斯池2 x2马克斯池步(2 - 2)和填充[0 0 0 0]5“完全连接10完全连接层6”Softmax Softmax crossentropyex 7”分类输出

互換性の考慮事項

すべて展開する

R2019b以降は非推奨

将来のリリースで動作変更

参照

Krizhevsky, A. I. Sutskever和G. E. Hinton。基于深度卷积神经网络的图像网络分类。神经信息处理系统研究进展。25卷,2012年。

[2] Cireşan, D., U. Meier, J. Schmidhuber。“图像分类的多列深度神经网络”。计算机视觉与模式识别,2012。

拡張機能

R2016aで導入