主要内容

激活

计算深度学习网络层激活

描述

您可以在CPU或GPU上计算深度学习网络层激活。使用GPU需要并行计算工具箱™和受支持的GPU设备。金宝app有关受支持设备的信息,请参见金宝appGPU支金宝app持版本(并行计算工具箱)属性指定硬件需求ExecutionEnvironment名称-值对参数。

行为=激活(洛桑国际管理发展学院使用训练过的网络返回特定层的网络激活而图像数据在图像数据存储中洛桑国际管理发展学院

行为=激活(ds使用数据存储中的数据返回网络激活ds

行为=激活(X使用数字数组中的图像或特征数据返回网络激活X

行为=激活(, X1,…,XN)返回数值数组中数据的网络激活X1、……XN对于多输入网络.输入西对应于网络输入net.InputNames(我)

行为=激活(序列返回循环网络(例如LSTM或GRU网络)的网络激活,其中序列包含序列或时间序列预测器。

行为=激活(资源描述使用表中的数据返回网络激活资源描述

例子

行为=激活(___名称,值返回由一个或多个名-值对参数指定的附加选项的网络激活。例如,“OutputAs”、“行”指定激活输出格式为“行”.在所有其他输入参数之后指定名称-值对参数。

例子

全部折叠

这个例子展示了如何从预训练的卷积神经网络中提取学习到的图像特征,并使用这些特征来训练图像分类器。特征提取是使用预训练深度网络的表示能力的最简单和最快的方法。例如,您可以使用训练支持向量机(SVM)金宝appfitcecoc(统计和机器学习工具箱™)对提取的特征。因为特征提取只需要通过数据一次,如果你没有GPU来加速网络训练,这是一个很好的起点。

加载数据

解压缩并将示例图像加载为图像数据存储。imageDatastore根据文件夹名称自动标记图像,并将数据存储为ImageDatastore对象。图像数据存储允许您存储大型图像数据,包括不适合内存的数据。将数据分成70%的训练数据和30%的测试数据。

解压缩(“MerchData.zip”);imds = imageDatastore(“MerchData”...“IncludeSubfolders”,真的,...“LabelSource”“foldernames”);[imdsTrain,imdsTest] = splitEachLabel(imds,0.7,“随机”);

这个非常小的数据集现在有55张训练图像和20张验证图像。显示一些示例图像。

numImagesTrain = numel(imdsTrain.Labels);idx = randperm(numImagesTrain,16);I = imtile(imds,“帧”, idx);图imshow(我)

图中包含一个轴。坐标轴包含一个image类型的对象。

负荷预训练网络

加载预训练的SqueezeNet网络。SqueezeNet接受了超过100万张图像的训练,可以将图像分为1000个对象类别,例如键盘、鼠标、铅笔和许多动物。因此,该模型已经学习了广泛图像的丰富特征表示。

网=挤压网;

分析网络结构。

analyzeNetwork(净)

第一层是图像输入层,需要输入图像的大小为227 × 227 × 3,其中3是颜色通道的数量。

inputSize = net.Layers(1).InputSize
inputSize =1×3227 227 3

提取图像特征

该网络构造了输入图像的分层表示。较深的层包含较高级的特征,这些特征是使用较早层的较低级特征构造的。要获得训练图像和测试图像的特征表示,请使用激活在全局平均池化层“pool10”.要获得图像的较低级别表示,请使用网络中的较早层。

网络需要大小为227 × 227 × 3的输入映像,但是映像数据存储中的映像具有不同的大小。若要在将训练和测试图像输入到网络之前自动调整它们的大小,请创建增强图像数据存储,指定所需的图像大小,并将这些数据存储用作的输入参数激活

augimdsTrain = augmentedImageDatastore(inputSize(1:2),imdsTrain);augimdsTest = augmentedImageDatastore(inputSize(1:2),imdsTest);层=“pool10”;featuresTrain =激活(net,augimdsTrain,layer,“OutputAs”“行”);featuresTest =激活(net,augimdsTest,layer,“OutputAs”“行”);

从训练和测试数据中提取类标签。

YTrain = imdsTrain.Labels;YTest = imdsTest.Labels;

拟合图像分类器

利用从训练图像中提取的特征作为预测变量,拟合多类支持向量机(SVM)金宝appfitcecoc(统计和机器学习工具箱)。

mdl = fitcecoc(featuresTrain,YTrain);

分类测试图像

使用训练好的SVM模型和从测试图像中提取的特征对测试图像进行分类。

YPred = predict(mdl, featurest);

显示四个样本测试图像及其预测标签。

Idx = [1 5 10 15];数字i = 1: nummel (idx) subplot(2,2,i) i = readimage(imdsTest,idx(i));标签= YPred(idx(i));imshow (I)标题(标签)结束

图包含4个轴。标题为MathWorks Cap的坐标轴1包含一个image类型的对象。标题为MathWorks Cube的坐标轴2包含一个image类型的对象。标题为MathWorks Playing Cards的坐标轴3包含一个image类型的对象。标题为MathWorks螺丝刀的轴4包含一个图像类型的对象。

计算测试集上的分类精度。准确率是网络正确预测的标签的比例。

accuracy = mean(YPred == YTest)
准确度= 1

该支持向量机具有较高的精度。如果使用特征提取的准确率不够高,那么可以尝试迁移学习。

输入参数

全部折叠

训练过的网络,指定为SeriesNetwork或者一个DAGNetwork对象。可以通过导入预训练的网络(例如,通过使用googlenet函数)或通过训练自己的网络使用trainNetwork

映像数据存储,指定为ImageDatastore对象。

ImageDatastore允许批量读取JPG或PNG图像文件使用预取。如果使用自定义函数读取图像,则ImageDatastore不预取。

提示

使用augmentedImageDatastore用于深度学习图像的有效预处理,包括图像大小调整。

请勿使用readFcn选择imageDatastore用于预处理或调整大小,因为此选项通常显着较慢。

内存不足数据和预处理的数据存储。数据存储必须返回表或单元格数组中的数据。数据存储输出的格式取决于网络架构。

网络体系结构 数据存储输出 示例输出
单输入

表或单元格数组,其中第一列指定预测器。

表元素必须是标量、行向量或包含数字数组的1乘1单元格数组。

自定义数据存储必须输出表。

数据=读取(ds)
data = 4×1 table Predictors __________________ {224×224×3 double} {224×224×3 double} {224×224×3 double} {224×224×3 double}
数据=读取(ds)
Data = 4×1 cell array {224×224×3 double} {224×224×3 double} {224×224×3 double} {224×224×3 double}
多个输入

单元格数组至少numInputs列,numInputs是网络输入的数量。

第一个numInputs列指定每个输入的预测器。

输入的顺序由InputNames网络属性。

数据=读取(ds)
Data = 4×2 cell array {224×224×3 double} {128×128×3 double} {224×224×3 double} {128×128×3 double} {224×224×3 double} {128×128×3 double} {224×224×3 double} {128×128×3 double}

预测器的格式取决于数据的类型。

数据 预测词的格式
二维图像

h——- - - - - -w——- - - - - -c数字数组,其中hw,c分别是图像的高度、宽度和通道数。

三维图像

h——- - - - - -w——- - - - - -d——- - - - - -c数字数组,其中hwd,c分别是图像的高度、宽度、深度和通道数。

向量序列

c——- - - - - -年代矩阵,c序列的特征数和年代是序列长度。

二维图像序列

h——- - - - - -w——- - - - - -c——- - - - - -年代数组,hw,c分别对应图像的高度、宽度和通道数,和年代是序列长度。

小批中的每个序列必须具有相同的序列长度。

三维图像序列

h——- - - - - -w——- - - - - -d——- - - - - -c——- - - - - -年代数组,hwd,c分别对应图像的高度、宽度、深度和通道数,和年代是序列长度。

小批中的每个序列必须具有相同的序列长度。

特性

c-by-1列向量,其中c是特征的数量。

有关更多信息,请参见用于深度学习的数据存储

图像或特征数据,指定为数字数组。数组的大小取决于输入的类型:

输入 描述
二维图像 一个h——- - - - - -w——- - - - - -c——- - - - - -N数字数组,其中hw,c图像的高度、宽度和通道数分别是和N是图像的数量。
三维图像 一个h——- - - - - -w——- - - - - -d——- - - - - -c——- - - - - -N数字数组,其中hwd,c图像的高度、宽度、深度和通道数分别为和N是图像的数量。
特性 一个N——- - - - - -numFeatures数字数组,其中N观察的次数和numFeatures输入数据的特征数。

如果数组包含S,然后它们在网络中传播。

对于有多个输入的网络,可以指定多个数组X1、……XN,在那里N网络输入和输入的数量是多少西对应于网络输入net.InputNames(我)

对于图像输入,如果“OutputAs”选择是“渠道”,然后在图像中输入数据X可以比网络输入层的图像输入大小更大。对于其他输出格式,在X必须具有与网络图像输入层的输入大小相同的大小。

序列或时间序列数据,指定为N-by-1单元格数组的数值数组,其中N观察数、表示单个序列的数字数组或数据存储。

对于单元格数组或数值数组输入,包含序列的数值数组的维数取决于数据的类型。

输入 描述
向量序列 c——- - - - - -年代矩阵,c序列特征的数量和年代是序列长度。
二维图像序列 h——- - - - - -w——- - - - - -c——- - - - - -年代数组,hw,c分别对应图像的高度、宽度和通道数,和年代是序列长度。
三维图像序列 h——- - - - - -w——- - - - - -d——- - - - - -c——- - - - - -年代,在那里hwd,c分别对应三维图像的高度、宽度、深度和通道数,和年代是序列长度。

对于数据存储输入,数据存储必须以序列单元格数组或第一列包含序列的表的形式返回数据。序列数据的维数必须与上表对应。

图像或特征数据表。表中的每一行都对应一个观察值。

表列中预测器的排列取决于输入数据的类型。

输入 预测
图像数据
  • 图像的绝对或相对文件路径,指定为单列中的字符向量

  • 指定为3-D数字数组的图像

在单个列中指定预测器。

特性数据

数字标量。

在第一个中指定预测器numFeatures表的列,其中numFeatures输入数据的特征数。

此参数只支持单输入网络。金宝app

数据类型:表格

层,从中提取激活,指定为数值索引或字符向量。

计算a的活化度SeriesNetwork对象时,使用其数值索引指定层,或作为对应于层名的字符向量指定层。

计算a的活化度DAGNetwork对象时,将该层指定为与层名对应的字符向量。如果图层有多个输出,指定图层和输出为图层名称,后面跟着字符“/”,然后是图层输出的名称。也就是说,形式是“layerName / outputName”

例子:3.

例子:“conv1”

例子:“mpool /出”

名称-值对参数

的可选逗号分隔对名称,值参数。的名字参数名称和价值对应的值。的名字必须出现在引号内。您可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:激活(净,X,层,“OutputAs”,“行”)

输出激活的格式,指定为逗号分隔的对,由“OutputAs”,要么“渠道”“行”,或“列”.有关不同输出格式的描述,请参见行为

对于图像输入,如果“OutputAs”选择是“渠道”,然后在图像中输入数据X可以比网络输入层的图像输入大小更大。对于其他输出格式,在X必须具有与网络图像输入层的输入大小相同的大小。

例子:“OutputAs”、“行”

用于预测的小批的大小,指定为正整数。更大的迷你批处理需要更多的内存,但可以导致更快的预测。

例子:“MiniBatchSize”,256年

填充、截断或分割输入序列的选项,指定为下列之一:

  • “最长”-每个小批中的衬垫序列与最长序列具有相同的长度。这个选项不会丢弃任何数据,尽管填充会给网络带来噪声。

  • “最短”-截断每个小批中的序列,使其长度与最短序列相同。此选项确保不添加填充,但要以丢弃数据为代价。

  • 正整数-对于每个迷你批,将序列填充到指定长度的最近倍数,该倍数大于迷你批中最长的序列长度,然后将序列分割为指定长度的更小序列。如果发生分裂,那么软件将创建额外的小批。如果完整序列不适合内存,请使用此选项。或者,尝试通过设置。来减少每个小批的序列数“MiniBatchSize”选择较低的值。

有关填充、截断和分隔输入序列的效果的详细信息,请参见序列填充,截断和分割

例子:“SequenceLength”、“最短的

用于填充输入序列的值,指定为标量。该选项仅当SequenceLength“最长”或者一个正整数。不垫序列用,因为这样做会在整个网络中传播错误。

例子:“SequencePaddingValue”,1

填充或截断方向,指定为下列之一:

  • “对”-填充或截断右边的序列。序列在同一时间步开始,软件截断或增加填充序列的结束。

  • “左”-填充或截断左边的序列。该软件截断或添加填充到序列的开始,以便序列在同一时间步结束。

由于LSTM层处理序列数据一次一步,当层OutputMode属性是“最后一次”,最后时间步长的任何填充都会对层输出产生负面影响。若要在左侧填充或截断序列数据,请设置“SequencePaddingDirection”选项“左”

对于序列对序列网络(当OutputMode属性是“序列”对于每个LSTM层),第一时间步中的任何填充都会对早期时间步的预测产生负面影响。若要在右侧填充或截断序列数据,请设置“SequencePaddingDirection”选项“对”

有关填充、截断和分隔输入序列的效果的详细信息,请参见序列填充,截断和分割

性能优化,指定为由逗号分隔的对组成“加速”和以下其中之一:

  • “汽车”—自动应用大量适合输入网络和硬件资源的优化。

  • 墨西哥人的—编译并执行MEX函数。该选项仅在使用GPU时可用。使用GPU需要并行计算工具箱和支持的GPU设备。金宝app有关受支持设备的信息,请参见金宝appGPU支金宝app持版本(并行计算工具箱)如果并行计算工具箱或合适的GPU不可用,那么软件将返回一个错误。

  • “没有”-禁用所有加速。

默认选项为“汽车”.如果“汽车”指定,MATLAB®将应用许多兼容的优化。如果你使用“汽车”选项,MATLAB不生成MEX函数。

使用“加速”选项“汽车”而且墨西哥人的可以提供性能优势,但以增加初始运行时间为代价。具有兼容参数的后续调用速度更快。当您计划使用新的输入数据多次调用函数时,请使用性能优化。

墨西哥人的选项根据函数调用中使用的网络和参数生成并执行一个MEX函数。您可以同时拥有与单个网络关联的多个MEX功能。清除网络变量也会清除与该网络关联的任何MEX函数。

墨西哥人的选项仅在使用GPU时可用。您必须安装C/ c++编译器和GPU Coder™深度学习库接口支持包。金宝app使用MATLAB中的Ad金宝appd-On资源管理器安装支持包。有关设置说明,请参见墨西哥人设置(GPU编码器).GPU Coder不需要。

墨西哥人的选项不支持所有层。金宝app有关受支持层的列表,请参见金宝app金宝app支持层(GPU编码器).循环神经网络(RNNs)包含一个sequenceInputLayer不支持。金宝app

墨西哥人的选项不支持具有多个输入层或多个输金宝app出层的网络。

你不能使用MATLAB编译器™控件时部署网络墨西哥人的选择。

例子:“加速”、“墨西哥人的

硬件资源,指定为由逗号分隔的对组成“ExecutionEnvironment”和以下其中之一:

  • “汽车”-如果有GPU,请使用GPU;否则,请使用CPU。

  • “图形”—使用GPU。使用GPU需要并行计算工具箱和支持的GPU设备。金宝app有关受支持设备的信息,请参见金宝appGPU支金宝app持版本(并行计算工具箱)如果并行计算工具箱或合适的GPU不可用,那么软件将返回一个错误。

  • “cpu”—使用CPU。

例子:“ExecutionEnvironment”、“cpu的

输出参数

全部折叠

来自网络层的激活,作为数字数组或数字数组的单元格数组返回。的格式行为取决于输入数据的类型、层输出的类型和“OutputAs”选择。

图像或折叠序列输出

如果层输出图像或折叠序列数据,则行为数值数组。

“OutputAs” 行为
“渠道”

对于二维图像输出,行为是一个h——- - - - - -w——- - - - - -c——- - - - - -n数组,hw,c所选层的输出的高度、宽度和通道数分别是和n是图像的数量。在这种情况下,法》(::,:,我)控件的激活th形象。

对于3d图像输出,行为是一个h——- - - - - -w——- - - - - -d——- - - - - -c——- - - - - -n数组,hwd,c所选层的输出的高度、宽度、深度和通道数分别是和n是图像的数量。在这种情况下,法案(::,:,:,我)控件的激活th形象。

对于折叠的二维图像序列输出,行为是一个h——- - - - - -w——- - - - - -c————(n年代数组,其中hw,c分别为所选层输出的高度、宽度和通道数,n是序列数,和年代是序列长度。在这种情况下,法》(:,:,:,(t - 1) * n + k)包含时间步长的激活tk序列。

对于折叠的三维图像序列输出,行为是一个h——- - - - - -w——- - - - - -d——- - - - - -c————(n年代数组,其中hwd,c分别为所选层输出的高、宽、深和通道数,n是序列数,和年代是序列长度。在这种情况下,行为 (:,:,:,:,( t - 1) * n + k)包含时间步长的激活tk序列。

“行”

2-D和3-D图像输出,行为是一个n——- - - - - -矩阵,n是图像的数量和是来自该层的输出元素的数量。在这种情况下,法案(我,:)控件的激活th形象。

对于折叠的二维和三维图像序列输出,行为是一个(n年代)———矩阵,n是序列数,年代是序列长度,和是来自该层的输出元素的数量。在这种情况下,法》((t - 1) * n + k,:)包含时间步长的激活tk序列。

“列”

2-D和3-D图像输出,行为是一个——- - - - - -n矩阵,是所选层的输出元素的数量,和n是图像的数量。在这种情况下,法》(:,我)控件的激活th形象。

对于折叠的二维和三维图像序列输出,行为是一个————(n年代)矩阵,其中是所选图层输出元素的数量,n是序列数,和年代是序列长度。在这种情况下,法案(:,(t - 1) * n + k)包含时间步长的激活tk序列。

顺序输出

如果具有序列输出(例如,LSTM层输出模式“序列”),然后行为是单元格数组。在这种情况下,“OutputAs”选项必须是“渠道”

“OutputAs” 行为
“渠道”

对于矢量序列输出,行为是一个n-by-1单元格数组,的c——- - - - - -年代矩阵,n是序列数,c序列中特征的数量,和年代是序列长度。

对于二维图像序列输出,行为是一个n-by-1单元格数组,的h——- - - - - -w——- - - - - -c——- - - - - -年代矩阵,n是序列数,hw,c图像的高度、宽度和通道数分别是和年代是序列长度。

对于三维图像序列输出,行为是一个n-by-1单元格数组,的h——- - - - - -w——- - - - - -c——- - - - - -d——- - - - - -年代矩阵,n是序列数,hwd,c图像的高度、宽度、深度和通道数分别为和年代是序列长度。

在这些情况下,行为{我}控件的激活序列。

单时间步输出

如果输出序列的单个时间步长(例如具有输出模式的LSTM层)“最后一次”),然后行为数值数组。

“OutputAs” 行为
“渠道”

对于包含矢量数据的单个时间步长,行为是一个c——- - - - - -n矩阵,n序列数是和吗c是序列中特征的数量。

对于包含二维图像数据的单个时间步长,行为是一个h——- - - - - -w——- - - - - -c——- - - - - -n数组,n是序列数,hw,c分别是图像的高度、宽度和通道数。

对于包含三维图像数据的单个时间步长,行为是一个h——- - - - - -w——- - - - - -c——- - - - - -d——- - - - - -n数组,n是序列数,hwd,c分别为图像的高度、宽度、深度和通道数。

“行” n——- - - - - -矩阵,n是观察数,和所选图层的输出元素数。在这种情况下,法案(我,:)控件的激活序列。
“列” ——- - - - - -n矩阵,是所选层的输出元素的数量,和n是观测的数量。在这种情况下,法》(:,我)控件的激活th形象。

算法

当你训练一个网络使用trainNetwork函数,或者当您使用预测或验证函数时DAGNetwork而且SeriesNetwork对象,该软件使用单精度浮点运算来执行这些计算。用于训练、预测和验证的函数包括trainNetwork预测分类,激活.当您使用cpu和gpu训练网络时,该软件使用单精度算法。

参考文献

[1]工藤M.,富山J.,辛波M.。“使用穿过区域的多维曲线分类”模式识别信.第20卷,11-13号,第1103-1111页。

[2]UCI机器学习库:日语元音数据集.https://archive.ics.uci.edu/ml/datasets/Japanese+Vowels

扩展功能

在R2016a中引入