计算深度学习网络层激活
您可以在CPU或GPU上计算深度学习网络层激活。使用GPU需要并行计算工具箱™和受支持的GPU设备。金宝app有关受支持设备的信息,请参见金宝appGPU支金宝app持版本(并行计算工具箱).属性指定硬件需求ExecutionEnvironment
名称-值对参数。
这个例子展示了如何从预训练的卷积神经网络中提取学习到的图像特征,并使用这些特征来训练图像分类器。特征提取是使用预训练深度网络的表示能力的最简单和最快的方法。例如,您可以使用训练支持向量机(SVM)金宝appfitcecoc
(统计和机器学习工具箱™)对提取的特征。因为特征提取只需要通过数据一次,如果你没有GPU来加速网络训练,这是一个很好的起点。
加载数据
解压缩并将示例图像加载为图像数据存储。imageDatastore
根据文件夹名称自动标记图像,并将数据存储为ImageDatastore
对象。图像数据存储允许您存储大型图像数据,包括不适合内存的数据。将数据分成70%的训练数据和30%的测试数据。
解压缩(“MerchData.zip”);imds = imageDatastore(“MerchData”,...“IncludeSubfolders”,真的,...“LabelSource”,“foldernames”);[imdsTrain,imdsTest] = splitEachLabel(imds,0.7,“随机”);
这个非常小的数据集现在有55张训练图像和20张验证图像。显示一些示例图像。
numImagesTrain = numel(imdsTrain.Labels);idx = randperm(numImagesTrain,16);I = imtile(imds,“帧”, idx);图imshow(我)
负荷预训练网络
加载预训练的SqueezeNet网络。SqueezeNet接受了超过100万张图像的训练,可以将图像分为1000个对象类别,例如键盘、鼠标、铅笔和许多动物。因此,该模型已经学习了广泛图像的丰富特征表示。
网=挤压网;
分析网络结构。
analyzeNetwork(净)
第一层是图像输入层,需要输入图像的大小为227 × 227 × 3,其中3是颜色通道的数量。
inputSize = net.Layers(1).InputSize
inputSize =1×3227 227 3
提取图像特征
该网络构造了输入图像的分层表示。较深的层包含较高级的特征,这些特征是使用较早层的较低级特征构造的。要获得训练图像和测试图像的特征表示,请使用激活
在全局平均池化层“pool10”
.要获得图像的较低级别表示,请使用网络中的较早层。
网络需要大小为227 × 227 × 3的输入映像,但是映像数据存储中的映像具有不同的大小。若要在将训练和测试图像输入到网络之前自动调整它们的大小,请创建增强图像数据存储,指定所需的图像大小,并将这些数据存储用作的输入参数激活
.
augimdsTrain = augmentedImageDatastore(inputSize(1:2),imdsTrain);augimdsTest = augmentedImageDatastore(inputSize(1:2),imdsTest);层=“pool10”;featuresTrain =激活(net,augimdsTrain,layer,“OutputAs”,“行”);featuresTest =激活(net,augimdsTest,layer,“OutputAs”,“行”);
从训练和测试数据中提取类标签。
YTrain = imdsTrain.Labels;YTest = imdsTest.Labels;
拟合图像分类器
利用从训练图像中提取的特征作为预测变量,拟合多类支持向量机(SVM)金宝appfitcecoc
(统计和机器学习工具箱)。
mdl = fitcecoc(featuresTrain,YTrain);
分类测试图像
使用训练好的SVM模型和从测试图像中提取的特征对测试图像进行分类。
YPred = predict(mdl, featurest);
显示四个样本测试图像及其预测标签。
Idx = [1 5 10 15];数字为i = 1: nummel (idx) subplot(2,2,i) i = readimage(imdsTest,idx(i));标签= YPred(idx(i));imshow (I)标题(标签)结束
计算测试集上的分类精度。准确率是网络正确预测的标签的比例。
accuracy = mean(YPred == YTest)
准确度= 1
该支持向量机具有较高的精度。如果使用特征提取的准确率不够高,那么可以尝试迁移学习。
网
- - - - - -训练网络SeriesNetwork
对象|DAGNetwork
对象训练过的网络,指定为SeriesNetwork
或者一个DAGNetwork
对象。可以通过导入预训练的网络(例如,通过使用googlenet
函数)或通过训练自己的网络使用trainNetwork
.
洛桑国际管理发展学院
- - - - - -图像数据存储ImageDatastore
对象映像数据存储,指定为ImageDatastore
对象。
ImageDatastore
允许批量读取JPG或PNG图像文件使用预取。如果使用自定义函数读取图像,则ImageDatastore
不预取。
提示
使用augmentedImageDatastore
用于深度学习图像的有效预处理,包括图像大小调整。
请勿使用readFcn
选择imageDatastore
用于预处理或调整大小,因为此选项通常显着较慢。
ds
- - - - - -数据存储内存不足数据和预处理的数据存储。数据存储必须返回表或单元格数组中的数据。数据存储输出的格式取决于网络架构。
网络体系结构 | 数据存储输出 | 示例输出 |
---|---|---|
单输入 | 表或单元格数组,其中第一列指定预测器。 表元素必须是标量、行向量或包含数字数组的1乘1单元格数组。 自定义数据存储必须输出表。 |
数据=读取(ds) data = 4×1 table Predictors __________________ {224×224×3 double} {224×224×3 double} {224×224×3 double} {224×224×3 double} |
数据=读取(ds) Data = 4×1 cell array {224×224×3 double} {224×224×3 double} {224×224×3 double} {224×224×3 double} |
||
多个输入 | 单元格数组至少 第一个 输入的顺序由 |
数据=读取(ds) Data = 4×2 cell array {224×224×3 double} {128×128×3 double} {224×224×3 double} {128×128×3 double} {224×224×3 double} {128×128×3 double} {224×224×3 double} {128×128×3 double} |
预测器的格式取决于数据的类型。
数据 | 预测词的格式 |
---|---|
二维图像 | h——- - - - - -w——- - - - - -c数字数组,其中h,w,c分别是图像的高度、宽度和通道数。 |
三维图像 | h——- - - - - -w——- - - - - -d——- - - - - -c数字数组,其中h,w,d,c分别是图像的高度、宽度、深度和通道数。 |
向量序列 | c——- - - - - -年代矩阵,c序列的特征数和年代是序列长度。 |
二维图像序列 | h——- - - - - -w——- - - - - -c——- - - - - -年代数组,h,w,c分别对应图像的高度、宽度和通道数,和年代是序列长度。 小批中的每个序列必须具有相同的序列长度。 |
三维图像序列 | h——- - - - - -w——- - - - - -d——- - - - - -c——- - - - - -年代数组,h,w,d,c分别对应图像的高度、宽度、深度和通道数,和年代是序列长度。 小批中的每个序列必须具有相同的序列长度。 |
特性 | c-by-1列向量,其中c是特征的数量。 |
有关更多信息,请参见用于深度学习的数据存储.
X
- - - - - -图像或特征数据图像或特征数据,指定为数字数组。数组的大小取决于输入的类型:
输入 | 描述 |
---|---|
二维图像 | 一个h——- - - - - -w——- - - - - -c——- - - - - -N数字数组,其中h,w,c图像的高度、宽度和通道数分别是和N是图像的数量。 |
三维图像 | 一个h——- - - - - -w——- - - - - -d——- - - - - -c——- - - - - -N数字数组,其中h,w,d,c图像的高度、宽度、深度和通道数分别为和N是图像的数量。 |
特性 | 一个N——- - - - - -numFeatures 数字数组,其中N观察的次数和numFeatures 输入数据的特征数。 |
如果数组包含南
S,然后它们在网络中传播。
对于有多个输入的网络,可以指定多个数组X1
、……XN
,在那里N
网络输入和输入的数量是多少西
对应于网络输入net.InputNames(我)
.
对于图像输入,如果“OutputAs”
选择是“渠道”
,然后在图像中输入数据X
可以比网络输入层的图像输入大小更大。对于其他输出格式,在X
必须具有与网络图像输入层的输入大小相同的大小。
序列
- - - - - -序列或时间序列数据序列或时间序列数据,指定为N-by-1单元格数组的数值数组,其中N观察数、表示单个序列的数字数组或数据存储。
对于单元格数组或数值数组输入,包含序列的数值数组的维数取决于数据的类型。
输入 | 描述 |
---|---|
向量序列 | c——- - - - - -年代矩阵,c序列特征的数量和年代是序列长度。 |
二维图像序列 | h——- - - - - -w——- - - - - -c——- - - - - -年代数组,h,w,c分别对应图像的高度、宽度和通道数,和年代是序列长度。 |
三维图像序列 | h——- - - - - -w——- - - - - -d——- - - - - -c——- - - - - -年代,在那里h,w,d,c分别对应三维图像的高度、宽度、深度和通道数,和年代是序列长度。 |
对于数据存储输入,数据存储必须以序列单元格数组或第一列包含序列的表的形式返回数据。序列数据的维数必须与上表对应。
资源描述
- - - - - -图像或特征数据表表格
图像或特征数据表。表中的每一行都对应一个观察值。
表列中预测器的排列取决于输入数据的类型。
输入 | 预测 |
---|---|
图像数据 |
在单个列中指定预测器。 |
特性数据 | 数字标量。 在第一个中指定预测器 |
此参数只支持单输入网络。金宝app
数据类型:表格
层
- - - - - -层来提取激活层,从中提取激活,指定为数值索引或字符向量。
计算a的活化度SeriesNetwork
对象时,使用其数值索引指定层,或作为对应于层名的字符向量指定层。
计算a的活化度DAGNetwork
对象时,将该层指定为与层名对应的字符向量。如果图层有多个输出,指定图层和输出为图层名称,后面跟着字符“/”,然后是图层输出的名称。也就是说,层
形式是“layerName / outputName”
.
例子:3.
例子:“conv1”
例子:“mpool /出”
的可选逗号分隔对名称,值
参数。的名字
参数名称和价值
对应的值。的名字
必须出现在引号内。您可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家
.
激活(净,X,层,“OutputAs”,“行”)
“MiniBatchSize”
- - - - - -小批尺寸用于预测的小批的大小,指定为正整数。更大的迷你批处理需要更多的内存,但可以导致更快的预测。
例子:“MiniBatchSize”,256年
“SequenceLength”
- - - - - -选项填充,截断,或分割输入序列“最长”
(默认)|“最短”
|正整数填充、截断或分割输入序列的选项,指定为下列之一:
“最长”
-每个小批中的衬垫序列与最长序列具有相同的长度。这个选项不会丢弃任何数据,尽管填充会给网络带来噪声。
“最短”
-截断每个小批中的序列,使其长度与最短序列相同。此选项确保不添加填充,但要以丢弃数据为代价。
正整数-对于每个迷你批,将序列填充到指定长度的最近倍数,该倍数大于迷你批中最长的序列长度,然后将序列分割为指定长度的更小序列。如果发生分裂,那么软件将创建额外的小批。如果完整序列不适合内存,请使用此选项。或者,尝试通过设置。来减少每个小批的序列数“MiniBatchSize”
选择较低的值。
有关填充、截断和分隔输入序列的效果的详细信息,请参见序列填充,截断和分割.
例子:“SequenceLength”、“最短的
“SequencePaddingValue”
- - - - - -值来填充输入序列用于填充输入序列的值,指定为标量。该选项仅当SequenceLength
是“最长”
或者一个正整数。不垫序列用南
,因为这样做会在整个网络中传播错误。
例子:“SequencePaddingValue”,1
“SequencePaddingDirection”
- - - - - -填充或截断的方向“对”
(默认)|“左”
填充或截断方向,指定为下列之一:
“对”
-填充或截断右边的序列。序列在同一时间步开始,软件截断或增加填充序列的结束。
“左”
-填充或截断左边的序列。该软件截断或添加填充到序列的开始,以便序列在同一时间步结束。
由于LSTM层处理序列数据一次一步,当层OutputMode
属性是“最后一次”
,最后时间步长的任何填充都会对层输出产生负面影响。若要在左侧填充或截断序列数据,请设置“SequencePaddingDirection”
选项“左”
.
对于序列对序列网络(当OutputMode
属性是“序列”
对于每个LSTM层),第一时间步中的任何填充都会对早期时间步的预测产生负面影响。若要在右侧填充或截断序列数据,请设置“SequencePaddingDirection”
选项“对”
.
有关填充、截断和分隔输入序列的效果的详细信息,请参见序列填充,截断和分割.
“加速”
- - - - - -性能优化“汽车”
(默认)|墨西哥人的
|“没有”
性能优化,指定为由逗号分隔的对组成“加速”
和以下其中之一:
“汽车”
—自动应用大量适合输入网络和硬件资源的优化。
墨西哥人的
—编译并执行MEX函数。该选项仅在使用GPU时可用。使用GPU需要并行计算工具箱和支持的GPU设备。金宝app有关受支持设备的信息,请参见金宝appGPU支金宝app持版本(并行计算工具箱).如果并行计算工具箱或合适的GPU不可用,那么软件将返回一个错误。
“没有”
-禁用所有加速。
默认选项为“汽车”
.如果“汽车”
指定,MATLAB®将应用许多兼容的优化。如果你使用“汽车”
选项,MATLAB不生成MEX函数。
使用“加速”
选项“汽车”
而且墨西哥人的
可以提供性能优势,但以增加初始运行时间为代价。具有兼容参数的后续调用速度更快。当您计划使用新的输入数据多次调用函数时,请使用性能优化。
的墨西哥人的
选项根据函数调用中使用的网络和参数生成并执行一个MEX函数。您可以同时拥有与单个网络关联的多个MEX功能。清除网络变量也会清除与该网络关联的任何MEX函数。
的墨西哥人的
选项仅在使用GPU时可用。您必须安装C/ c++编译器和GPU Coder™深度学习库接口支持包。金宝app使用MATLAB中的Ad金宝appd-On资源管理器安装支持包。有关设置说明,请参见墨西哥人设置(GPU编码器).GPU Coder不需要。
的墨西哥人的
选项不支持所有层。金宝app有关受支持层的列表,请参见金宝app金宝app支持层(GPU编码器).循环神经网络(RNNs)包含一个sequenceInputLayer
不支持。金宝app
的墨西哥人的
选项不支持具有多个输入层或多个输金宝app出层的网络。
你不能使用MATLAB编译器™控件时部署网络墨西哥人的
选择。
例子:“加速”、“墨西哥人的
“ExecutionEnvironment”
- - - - - -硬件资源“汽车”
(默认)|“图形”
|“cpu”
硬件资源,指定为由逗号分隔的对组成“ExecutionEnvironment”
和以下其中之一:
“汽车”
-如果有GPU,请使用GPU;否则,请使用CPU。
“图形”
—使用GPU。使用GPU需要并行计算工具箱和支持的GPU设备。金宝app有关受支持设备的信息,请参见金宝appGPU支金宝app持版本(并行计算工具箱).如果并行计算工具箱或合适的GPU不可用,那么软件将返回一个错误。
“cpu”
—使用CPU。
例子:“ExecutionEnvironment”、“cpu的
行为
—网络层激活来自网络层的激活,作为数字数组或数字数组的单元格数组返回。的格式行为
取决于输入数据的类型、层输出的类型和“OutputAs”
选择。
如果层输出图像或折叠序列数据,则行为
数值数组。
“OutputAs” |
行为 |
---|---|
“渠道” |
对于二维图像输出, 对于3d图像输出, 对于折叠的二维图像序列输出, 对于折叠的三维图像序列输出, |
“行” |
2-D和3-D图像输出, 对于折叠的二维和三维图像序列输出, |
“列” |
2-D和3-D图像输出, 对于折叠的二维和三维图像序列输出, |
如果层
具有序列输出(例如,LSTM层输出模式“序列”
),然后行为
是单元格数组。在这种情况下,“OutputAs”
选项必须是“渠道”
.
“OutputAs” |
行为 |
---|---|
“渠道” |
对于矢量序列输出, 对于二维图像序列输出, 对于三维图像序列输出, 在这些情况下, |
如果层
输出序列的单个时间步长(例如具有输出模式的LSTM层)“最后一次”
),然后行为
数值数组。
“OutputAs” |
行为 |
---|---|
“渠道” |
对于包含矢量数据的单个时间步长, 对于包含二维图像数据的单个时间步长, 对于包含三维图像数据的单个时间步长, |
“行” |
n——- - - - - -米矩阵,n是观察数,和米 所选图层的输出元素数。在这种情况下,法案(我,:) 控件的激活我 序列。 |
“列” |
米——- - - - - -n矩阵,米是所选层的输出元素的数量,和n是观测的数量。在这种情况下,法》(:,我) 控件的激活我 th形象。 |
当你训练一个网络使用trainNetwork
函数,或者当您使用预测或验证函数时DAGNetwork
而且SeriesNetwork
对象,该软件使用单精度浮点运算来执行这些计算。用于训练、预测和验证的函数包括trainNetwork
,预测
,分类
,激活
.当您使用cpu和gpu训练网络时,该软件使用单精度算法。
[1]工藤M.,富山J.,辛波M.。“使用穿过区域的多维曲线分类”模式识别信.第20卷,11-13号,第1103-1111页。
[2]UCI机器学习库:日语元音数据集.https://archive.ics.uci.edu/ml/datasets/Japanese+Vowels
使用注意事项和限制:
c++代码生成支持以下语法:金宝app
act =激活(净,X,层)
Act =激活(净,序列,层)
act =激活(__,名称,值)
输入X
不能有可变大小。输入的大小必须在代码生成时固定。
对于矢量序列输入,在代码生成过程中特征的数量必须是一个常数。序列长度可以是可变大小的。
对于图像序列输入,在代码生成过程中,高度、宽度和通道数必须为常数。
的层
参数在代码生成期间必须是常量。
只有“OutputAs”
,“MiniBatchSize”
,“SequenceLength”
,“SequencePaddingDirection”
,“SequencePaddingValue”
代码生成支持名称-值对参数。金宝app所有的名称-值对必须是编译时常量。
输出激活的格式必须为“渠道”
.
只有“最长”
而且“最短”
选项“SequenceLength”
代码生成支持名称-值对。金宝app
Intel代码生成®MKL-DNN靶不支持组合金宝app“SequenceLength”,“最长”
,“SequencePaddingDirection”、“左派”
,“SequencePaddingValue”,0
名称-值参数。
有关为深度学习神经网络生成代码的更多信息,请参见使用MATLAB编码器进行深度学习代码生成的工作流程(MATLAB编码器).
使用注意事项和限制:
GPU代码生成支持以下语法:金宝app
act =激活(净,X,层)
Act =激活(净,序列,层)
act =激活(__,名称,值)
输入X
不能有可变大小。输入的大小必须在代码生成时固定。
不支持GPU代码生成金宝appgpuArray
的输入激活
函数。
cuDNN库支持向量和二维图像序列。金宝appTensorRT库只支持向量输入序列。金宝app手臂®计算库
for GPU不支持循环网络。金宝app
对于矢量序列输入,在代码生成过程中特征的数量必须是一个常数。序列长度可以是可变大小的。
对于图像序列输入,在代码生成过程中,高度、宽度和通道数必须为常数。
的层
参数在代码生成期间必须是常量。
只有“OutputAs”
,“MiniBatchSize”
,“SequenceLength”
,“SequencePaddingDirection”
,“SequencePaddingValue”
代码生成支持名称-值对参数。金宝app所有的名称-值对必须是编译时常量。
输出激活的格式必须为“渠道”
.
只有“最长”
而且“最短”
选项“SequenceLength”
代码生成支持名称-值对。金宝app
GPU代码生成的激活
函数支持定义为半精金宝app度浮点数据类型的输入。有关更多信息,请参见一半
(GPU编码器).
当输入数据为gpuArray
的单元格数组或表gpuArray
数据,或返回的数据存储gpuArray
数据,“ExecutionEnvironment”
选项必须是“汽车”
或“图形”
.
有关更多信息,请参见在图形处理器上运行MATLAB函数(并行计算工具箱).
你点击了一个对应于这个MATLAB命令的链接:
在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
您也可以从以下列表中选择一个网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。