主要内容

fasterRCNNLayers

创建一个更快的R-CNN对象检测网络

描述

例子

lgraph= fasterRCNNLayers (inputImageSizenumClassesanchorBoxes网络返回更快的R-CNN网络作为一个layerGraph(深度学习工具箱)对象。Faster R-CNN网络是一种基于卷积神经网络的目标检测器。检测器预测一组锚盒的边界盒坐标、客观性得分和分类得分。要训练创建的网络,使用trainFasterRCNNObjectDetector函数。有关更多信息,请参见开始与R-CNN,快速的R-CNN,更快的R-CNN

lgraph= fasterRCNNLayers (inputImageSizenumClassesanchorBoxes网络featureLayer返回指定的对象检测网络featureLayer的网络。将网络指定为SeriesNetwork(深度学习工具箱)DAGNetwork(深度学习工具箱),或layerGraph(深度学习工具箱).对象。

lgraph= fasterRCNNLayers (___名称,值返回带有由一个或多个名称-值对参数指定的可选输入属性的对象检测网络。

使用此功能需要深度学习工具箱™。

例子

全部折叠

指定图像大小。

inputImageSize = [224 224 3];

指定要检测的对象的数量。

numClasses = 1;

使用预先训练的ResNet-50网络作为Faster R-CNN网络的基础网络。你必须下载resnet50(深度学习工具箱)金宝app支持包。

网络=“resnet50”

指定用于特征提取的网络层。你可以使用analyzeNetwork(深度学习工具箱)函数查看网络中所有层的名称。

featureLayer =“activation_40_relu”

指定锚框。你也可以用theestimateAnchorBoxes函数从训练数据估计锚框。

anchorBoxes =[64、64;128128;192192);

创建更快的R-CNN对象检测网络。

lgraph = fasterRCNNLayers (inputImageSize numClasses anchorBoxes,...网络、featureLayer)
lgraph = LayerGraph with properties: Layers: [188x1 net.cnn.layer. layer] Connections: [205x2 table] InputNames: {'input_1'} OutputNames: {1x4 cell}

使用网络分析器可视化网络。

analyzeNetwork (lgraph)

输入参数

全部折叠

网络输入图像大小,指定为格式为[高度宽度深度].深度为图像通道的个数。集深度3.对于RGB图像,要1对于灰度图像,或多光谱和高光谱图像的通道数。

网络要分类的类数,指定为大于0的整数。

锚盒,指定为2的矩阵格式[高度宽度].锚盒根据训练数据集中目标的比例和宽高比确定。例如,如果一个对象是由一个方形窗口本地化的,那么您可以设置锚框的大小为(128年64 64;128)

预先训练的分类网络,指定为SeriesNetwork(深度学习工具箱)DAGNetwork(深度学习工具箱),或layerGraph(深度学习工具箱),或下列情形之一:

当您指定网络为SeriesNetwork(深度学习工具箱)对象,DAGNetwork(深度学习工具箱)对象,或通过名称,该函数将网络转换为Faster R-CNN网络。该算法通过增加区域建议网络(RPN)、ROI最大池化层以及新的分类和回归层来支持目标检测。金宝app

特征提取层,指定为字符向量或字符串标量。使用您指定的网络中的更深层次之一。你可以使用analyzeNetwork(深度学习工具箱)命令功能,查看输入网络中各层的名称。

请注意

可以指定除完全连接层外的任何网络层为特征层。

名称-值对的观点

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“ROIMaxPoolingLayer”“汽车”

最大投资回报率池层,指定为“汽车”“插入”,或“替换”.你可以指定是否roiMaxPooling2dLayer替换池化层或跟随特征提取层。

如果您选择“汽车”功能:

  • 当特征提取层旁边的一层不是最大池化层时,在特征提取层之后插入新的ROI最大池化层。

  • 将特征提取层后的当前池化层替换为ROI最大池化层。

ROI最大池化层输出大小,指定为“汽车”或者是一个2元的正整数向量。当设置为时“汽车”时,函数根据ROIMaxPoolingLayer财产。它使用特征提取层或特征提取层之后的池化层的输出大小。

输出参数

全部折叠

对象检测网络,返回为layerGraph(深度学习工具箱)对象。输出和基网imageInputLayer标准化值是相等的。

介绍了R2019b