gradCAM

使用Grad-CAM解释网络预测

折叠所有页面

语法

scoreMap = gradCAM(net,X,label)

scoreMap = gradCAM(net,X,reductionFcn)

[scoreMap,featureLayer,reductionLayer] = gradCAM(___）

___= gradCAM (___、名称、值)

描述

例子

scoreMap= gradCAM (网，X，标签）返回图像分类分数变化的梯度加权类激活映射(Grad-CAM)映射X，当网络网为所给出的类计算类的分数标签．使用此函数解释网络预测，并检查网络是否专注于图像的正确部分。

Grad-CAM可解释性技术使用分类分数相对于最终卷积特征图的梯度。图像中对Grad-CAM地图具有较大值的部分是对该类网络分数影响最大的部分。

使用此语法计算图像或像素分类任务的Grad-CAM映射。

例子

scoreMap= gradCAM (网，X，reductionFcn）使用约简函数返回Grad-CAM重要性图。reductionFcn将还原层的输出激活还原为标量值的函数句柄。这个标量在分类任务中扮演班级分数的角色，并将Grad-CAM技术推广到非分类任务，例如回归。

的gradCAM函数通过将约简层的约简输出与特征层中的特征进行微分来计算Grad-CAM映射。gradCAM自动选择减少和特征层使用时，计算地图。要指定这些层，请使用“ReductionLayer”而且“FeatureLayer”名称-值参数。

使用此语法计算非分类任务的Grad-CAM映射。

［scoreMap，featureLayer，reductionLayer= gradCAM(___）还返回用于计算Grad-CAM映射的特征层和还原层的名称。将此语法与以前语法中的任何输入-参数组合一起使用。

例子

___= gradCAM (___，名称,值）除以前语法中的输入参数外，还使用一个或多个名称-值参数指定选项。例如,“ReductionLayer”、“概率”设置还原层为网层命名为“概率”．

例子

全部折叠

使用Grad-CAM探索网络分类

打开实时脚本

使用gradCAM可视化图像的哪些部分对网络的分类决策是重要的。

导入预训练的网络SqueezeNet。

网=挤压网;

导入图像并调整其大小以匹配网络的输入大小。

X = imread(“laika_grass.jpg”）;inputSize = net.Layers(1).InputSize(1:2);X = imresize(X,inputSize);

显示图像。

imshow (X)

对图像进行分类以获得类标签。

标签=分类(net,X)

标签=分类玩具贵宾犬

使用gradCAM确定图像的哪些部分对分类结果是重要的。

scoreMap = gradCAM(net,X,label);

将结果绘制在透明的原始图像上，以查看图像的哪些区域对分类分数的贡献最大。

图imshow(X)稍等在显示亮度图像(scoreMap“AlphaData”, 0.5) colormap飞机

该网络主要关注狗的背部来做出分类决定。

计算图像回归网络的Grad-CAM地图

打开实时脚本

使用Grad-CAM来可视化图像的哪些部分对图像回归网络的预测最重要。

加载由手写数字合成图像组成的样本数据。第三个输出包含数字的相应旋转角度，以度为单位。

rng默认的[XTrain，~，YTrain] = digitTrain4DArrayData;[XTest，~，YTest] = digitTest4DArrayData;numTrainImages =数字(YTrain);idx = randperm(numTrainImages,20);

构造一个可以预测图像旋转的图像回归网络。

层= [.．.imageInputLayer([28 28 1]，“名字”，“输入”25) convolution2dLayer(12日,“名字”，“conv”) reluLayer (“名字”，“relu”) fullyConnectedLayer (1,“名字”，“俱乐部”) regressionLayer (“名字”，“输出”));

指定培训选项。

选项= trainingOptions(“个”，.．.“InitialLearnRate”, 0.001,.．.“详细”假的,.．.“阴谋”，“训练进步”）;

培训网络。

net = trainNetwork(XTrain,YTrain，图层，选项);

在测试图像上评估网络的性能。

testDigit = XTest(:，:，:，idx(4));

使用预测预测旋转角度，并将预测旋转与真实旋转进行比较。

预drotation =预测(净，testDigit)

predRotation =单-47.5497

trueRotation = YTest(idx(4))

trueRotation = -40

可视化图像中对网络预测最重要的区域gradCAM．选择ReLU层作为特征层，全连通层作为约简层。

featureLayer =“relu”；reductionLayer =“俱乐部”；

定义约简函数。还原函数必须将还原层的输出还原为一个标量值。Grad-CAM映射显示图像不同部分对该标量的重要性。在这个回归问题中，网络预测图像的旋转角度。因此，全连通层的输出已经是一个标量值，因此约简函数就是恒等函数。

reductionFcn = @(x)x;

计算Grad-CAM地图。

scoreMap = gradCAM(net,testDigit,reductionFcn，.．.“ReductionLayer”reductionLayer,.．.“FeatureLayer”, featureLayer);

在测试图像上显示Grad-CAM映射。

Ax (1) = subplot(1,2,1);imshow (testDigit)标题("真旋转= "+ trueRotation +'\newline Pred Rotation = '+ round(predRotation,0)) colormap(ax(1)，“灰色”) ax(2) = subplot(1,2,2);imshow (testDigit)在显示亮度图像(scoreMap) colormap (ax (2),“喷气机”)标题(“GradCAM”)举行从

Grad-CAM地图显示网络聚焦于左下角的区域，如果图像旋转为零，数字的尾部就会在这里。该地图表明，为了预测负旋转，该网络正在使用空白空间。

输入参数

全部折叠

`网`- - - - - -训练网络
`SeriesNetwork`|`DAGNetwork`|`dlnetwork`

训练过的网络，指定为SeriesNetwork，DAGNetwork,或dlnetwork对象。可以通过导入预训练的网络或使用trainNetwork功能或定制培训。有关预训练网络的更多信息，请参见预训练的深度神经网络．

网必须包含单个输入层和单个输出层。的输入层网一定是imageInputLayer或者一个image3dInputLayer．

`X`- - - - - -输入数据
数字数组|`dlarray`

输入数据，指定为数字数组或格式化dlarray对象。

X大小必须等于网络的输入大小。

数据类型:单|双|int8|int16|int32|int64|uint8|uint16|uint32|uint64

`标签`- - - - - -类标签
分类|特征向量|字符串标量|数字索引

类标签，用于计算用于图像分类和语义分割任务的Grad-CAM映射，指定为类别、字符向量、字符串标量、数值索引或这些值的向量。

为dlnetwork对象，必须指定标签作为分类索引或数字索引。

如果你指定标签作为一个向量，软件独立计算每个类标签的特征重要性。这样的话，scoreMap (:,:, k)对应于的映射标签(k)．

的gradCAM函数对类的约简层的空间维度求和标签．因此，您可以指定标签作为感兴趣的类的语义分割任务和gradCAM返回每个像素的Grad-CAM重要性。

例子:["猫”“狗”)

例子:(1 - 5)

数据类型:字符|字符串|分类

`reductionFcn`- - - - - -还原功能
函数处理

还原函数，指定为函数句柄。约简函数将约简层的输出激活减少到单个值，并且必须减少adlarray对象的dlarray标量。这个标量的作用是标签在分类任务中，并将Grad-CAM技术推广到非分类任务，如回归。

Grad-CAM使用约简层的减少输出激活来计算重要性映射的梯度。

例子:@x (x)

数据类型:function_handle

名称-值参数

的可选逗号分隔对名称,值参数。的名字参数名称和价值对应的值。的名字必须出现在引号内。您可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家．

例子:

“FeatureLayer”、“conv10’,‘ReductionLayer’,‘问题’,‘OutputUpsampling’,‘双三次的’,‘ExecutionEnvironment’,‘gpu’

计算关于图层的Grad-CAM地图“conv10”而且“概率”，在GPU上执行计算，并使用双三次插值将结果映射上采样到与输入图像相同的大小。

`FeatureLayer`- - - - - -特征层名称
字符串|特征向量

计算Grad-CAM映射时要从中提取特征映射的特征层的名称，指定为字符串或字符向量。对于大多数任务，使用最后一个具有非单空间维度的ReLU层或最后一个收集ReLU层输出的层(例如深度拼接或添加层)。如果您的网络不包含任何ReLU层，请指定在输出中具有非单例空间维度的最终卷积层的名称。

默认值是具有非单空间维度的最后一层。使用analyzeNetwork函数检查网络并选择正确的层。

例子:“FeatureLayer”、“conv10”

数据类型:字符|字符串

`ReductionLayer`- - - - - -还原层名称
字符串|特征向量

计算Grad-CAM映射时从中提取输出激活的还原层的名称，指定为字符串或字符向量。对于分类任务，这一层通常是最终的softmax层。对于其他任务，这一层通常是DAG和系列网络的倒数第二层，是DAG和系列网络的最后一层dlnetwork对象。

在DAG和串联网络中，默认值是倒数第二层，在网络中是最后一层dlnetwork对象。使用analyzeNetwork函数检查网络并选择正确的层。

例子:“ReductionLayer”、“概率”

数据类型:字符|字符串

`格式`- - - - - -数据格式
特征向量|字符串

为输入数据的每个维度分配标签的数据格式，指定为字符向量或字符串。格式中的每个字符必须是以下维度标签之一:

年代——空间
C——频道
B——批

有关更多信息，请参见dlarray．

例子:“格式”、“SSC的

数据类型:字符|字符串

`OutputUpsampling`- - - - - -输出上采样法
`“双三次的”`(默认)|`“最近的”`|`“没有”`

输出上采样方法，指定为由逗号分隔的对组成“OutputUpsampling”和以下值之一:

“双三次的”-使用双三次插值生成与输入数据相同大小的平滑地图。
“最近的”—使用最近邻插值将映射扩展到与输入数据相同的大小。
“没有”-不使用上采样。映射可以小于输入数据。

如果“OutputUpsampling”是“最近的”或“双三次的”方法将计算的映射上采样到输入数据的大小imresize函数用于二维数据和imresize3(图像处理工具箱)三维数据的函数。对于3-D数据，选项“双三次的”使用imresize3与“立方”方法。

例子:“OutputUpsampling”、“双三次的“

`ExecutionEnvironment`- - - - - -硬件资源
`“汽车”`(默认)|`“cpu”`|`“图形”`

用于计算映射的硬件资源，指定为由逗号分隔的对组成“ExecutionEnvironment”下面是其中之一。

“汽车”—如果有GPU，请使用GPU。否则请使用CPU。
“cpu”—使用CPU。
“图形”—使用GPU。

GPU选项需要并行计算工具箱™。要使用GPU进行深度学习，还必须有支持GPU的设备。金宝app有关受支持设备的信息，请参见金宝appGPU支金宝app持版本(并行计算工具箱)．如果你选择“图形”选项和并行计算工具箱和合适的GPU不可用，那么软件返回一个错误。

例子:“ExecutionEnvironment”、“gpu的

输出参数

全部折叠

`scoreMap`- Grad-CAM重要性图
数值矩阵|数值数组

Grad-CAM重要性映射，作为数值矩阵或数值数组返回。地图中具有较高正值的区域对应于输入数据中对预测有积极贡献的区域。

对于分类任务，scoreMap是指定类别的最终分类分数相对于特征层中的每个特征的梯度。
对于其他类型的任务，scoreMap是约简层的约简输出相对于特征层中的每个特征的梯度。

scoreMap (i, j)对应于Grad-CAM在空间位置上的重要性(i, j)．如果你提供标签作为类别向量，字符向量或字符串的向量，那么scoreMap (:,:, k)对应于的映射标签(k)．

`featureLayer`—特征层名称
字符串

计算Grad-CAM映射时要从中提取特征映射的特征层名称，以字符串形式返回。

默认情况下,gradCAM选择一个特征层来计算Grad-CAM地图。这一层是具有非单空间维度的最后一层。属性指定要使用的特性层“FeatureLayer”名称-值参数。当您指定“FeatureLayer”名称-值参数,featureLayer返回相同的值。

`reductionLayer`-还原层名称
字符串

计算Grad-CAM映射时提取输出激活的还原层的名称，以字符串形式返回。

默认情况下,gradCAM选择一个还原层来计算Grad-CAM地图。这一层是DAG和系列网络的倒数第二层，也是网络的最后一层dlnetwork对象。属性指定要使用的还原层“ReductionLayer”名称-值参数。当您指定“ReductionLayer”名称-值参数,reductionLayer返回相同的值。

提示

的reductionFcn函数从还原层接收输出作为跟踪dlarray对象。函数必须将此输出缩减为一个标量dlarray,这gradCAM然后对特征层的激活进行微分。例如，要计算网络softmax激活的208通道的Grad-CAM映射，约简函数为@ (x) (x (208))．该函数接收激活并提取第208通道。
的gradCAM函数在计算Grad-CAM地图时自动选择缩减和特征层。对于某些网络，所选择的层可能不合适。例如，如果您的网络有多个可以用作特征层的层，那么函数将选择其中一个层，但它的选择可能不是最合适的。属性指定要使用的特性层“FeatureLayer”名称-值参数。

参考文献

[1] Selvaraju, Ramprasaath R.， Michael Cogswell, Abhishek Das, Ramakrishna Vedantam, Devi Parikh和Dhruv Batra。“Grad-CAM:基于梯度定位的深度网络的视觉解释。2017(2017年10月):618-626,https://doi.org/10.1109/ICCV.2017.74。

维诺格拉多娃，基拉，亚历山大·迪布罗夫和吉恩·迈尔斯。“基于梯度加权类激活映射的可解释语义分割”AAAI人工智能会议论文集34岁的没有。10(2020年4月):13943-13944,https://doi.org/10.1609/aaai.v34i10.7244。

另请参阅

occlusionSensitivity|imageLIME|激活

主题

R2021a中引入

gradCAM

语法

描述

例子

使用Grad-CAM探索网络分类

计算图像回归网络的Grad-CAM地图

输入参数

`网`- - - - - -训练网络
`SeriesNetwork`|`DAGNetwork`|`dlnetwork`

`X`- - - - - -输入数据
数字数组|`dlarray`

`标签`- - - - - -类标签
分类|特征向量|字符串标量|数字索引

`reductionFcn`- - - - - -还原功能
函数处理

名称-值参数

`FeatureLayer`- - - - - -特征层名称
字符串|特征向量

`ReductionLayer`- - - - - -还原层名称
字符串|特征向量

`格式`- - - - - -数据格式
特征向量|字符串

`OutputUpsampling`- - - - - -输出上采样法
`“双三次的”`(默认)|`“最近的”`|`“没有”`

`ExecutionEnvironment`- - - - - -硬件资源
`“汽车”`(默认)|`“cpu”`|`“图形”`

输出参数

`scoreMap`- Grad-CAM重要性图
数值矩阵|数值数组

`featureLayer`—特征层名称
字符串

`reductionLayer`-还原层名称
字符串

更多关于

Grad-CAM

提示

参考文献

另请参阅

主题

深度学习工具箱文档

金宝app

用MATLAB介绍深度学习

gradCAM

语法

描述

例子

使用Grad-CAM探索网络分类

计算图像回归网络的Grad-CAM地图

输入参数

网- - - - - -训练网络SeriesNetwork|DAGNetwork|dlnetwork

X- - - - - -输入数据数字数组|dlarray

标签- - - - - -类标签分类|特征向量|字符串标量|数字索引

reductionFcn- - - - - -还原功能函数处理

名称-值参数

FeatureLayer- - - - - -特征层名称字符串|特征向量

ReductionLayer- - - - - -还原层名称字符串|特征向量

格式- - - - - -数据格式特征向量|字符串

OutputUpsampling- - - - - -输出上采样法“双三次的”(默认)|“最近的”|“没有”

ExecutionEnvironment- - - - - -硬件资源“汽车”(默认)|“cpu”|“图形”

输出参数

scoreMap- Grad-CAM重要性图数值矩阵|数值数组

featureLayer—特征层名称字符串

reductionLayer-还原层名称字符串

更多关于

Grad-CAM

提示

参考文献

另请参阅

主题

深度学习工具箱文档

金宝app

用MATLAB介绍深度学习

`网`- - - - - -训练网络
`SeriesNetwork`|`DAGNetwork`|`dlnetwork`

`X`- - - - - -输入数据
数字数组|`dlarray`

`标签`- - - - - -类标签
分类|特征向量|字符串标量|数字索引

`reductionFcn`- - - - - -还原功能
函数处理

`FeatureLayer`- - - - - -特征层名称
字符串|特征向量

`ReductionLayer`- - - - - -还原层名称
字符串|特征向量

`格式`- - - - - -数据格式
特征向量|字符串

`OutputUpsampling`- - - - - -输出上采样法
`“双三次的”`(默认)|`“最近的”`|`“没有”`

`ExecutionEnvironment`- - - - - -硬件资源
`“汽车”`(默认)|`“cpu”`|`“图形”`

`scoreMap`- Grad-CAM重要性图
数值矩阵|数值数组

`featureLayer`—特征层名称
字符串

`reductionLayer`-还原层名称
字符串