开始R-CNN,快R-CNN,快R-CNN

检测对象是寻找和一个图像中的对象进行分类的过程。一个深度学习方法,将具有卷积神经网络(R-CNN),结合了卷积神经网络的特点的矩形区域的建议区域。R-CNN是一个两阶段检测算法。第一个阶段确定可能包含一个对象的图像中的区域的子集。第二级分类中的每个区域中的对象。

用于R-CNN对象检测器的应用包括:

  • 自主驾驶

  • 智能监测系统

  • 面部识别

计算机视觉工具箱™为R-CNN、快速R-CNN和更快的R-CNN算法提供对象检测器。

使用R-CNN算法进行目标检测

使用具有CNNs的区域进行目标检测的模型基于以下三个过程:

  • 查找图像中可能包含对象的区域。这些区域被称为地区的建议

  • 从地区提案中提取CNN特征。

  • 分类使用所提取的特征的对象。

R-CNN有三种变体。每个变体都试图优化、加速或增强一个或多个这些过程的结果。

R-CNN

R-CNN探测器[2]首先使用诸如边缘框之类的算法生成区域建议[1]。建议区域从图像中裁剪出来并调整大小。然后,CNN对裁剪和调整大小的区域进行分类。最后,使用CNN特征训练的支持向量机(SVM)对区域建议边界框进行细化。金宝app

使用trainRCNNObjectDetector函数来训练R-CNN对象检测器。该函数返回rcnnObjectDetector对象,用于检测图像中的对象。

快R-CNN

作为在R-CNN检测器,快速R-CNN[3]检测器还使用像边缘盒的算法,以生成区域的建议。不同于R-CNN检测器,其作物和调整大小区域的建议,快速R-CNN检测器处理的整个图像。而一个R-CNN检测器必须每个区域进行分类,快速R-CNN池CNN特征相对应的每个区域的建议。快速R-CNN比R-CNN更高效的,因为在快速R-CNN检测器,用于重叠区域,计算被共享。

使用trainFastRCNNObjectDetector函数来训练一个快速的R-CNN对象探测器。函数返回一个fastRCNNObjectDetector其检测从图像对象。

快R-CNN

R-CNN越快[4]检测器增加了一个区域建议网络(RPN)来直接在网络中生成区域建议,而不是使用像边缘盒这样的外部算法。项使用用于对象检测的锚盒。在网络中产生区的建议是更快,更好地调整你的数据。

使用trainFasterRCNNObjectDetector函数来训练更快R-CNN对象检测器。函数返回一个fasterRCNNObjectDetector其检测从图像对象。

R-CNN对象探测器的比较

对象检测器的这个系列使用区域建议的图像内检测物体。提出区域的数量表明它需要以检测图像中的对象的时间。快速R-CNN和更快的R-CNN探测器被设计用于提高具有大的数量的区域的检测性能。

R-CNN探测器 描述
trainRCNNObjectDetector
  • 慢训练和检测

  • 允许自定义区域建议

trainFastRCNNObjectDetector
  • 允许自定义区域建议

trainFasterRCNNObjectDetector
  • 最优运行时性能

  • 不支持自定义区域建金宝app议

迁移学习

您可以使用预训练的卷积神经网络(CNN)作为R-CNN检测器的基础,也称为迁移学习。看到预训练深层神经网络(深学习工具箱)。使用带有下列网络之一trainRCNNObjectDetector,trainFasterRCNNObjectDetector,或trainFastRCNNObjectDetector功能。要使用这些网络,您必须安装相应的深度学习工具箱™模型:

你也可以设计一个自定义模型基于一个预先训练的图像分类CNN。看到设计一个R-CNN,快速R-CNN和更快的R-CNN型号节和深层网络设计师应用程序。

设计一个R-CNN,快速R-CNN和更快的R-CNN型号

您可以根据预训练图像分类CNN设计定制R-CNN模型。您也可以使用深层网络设计师要构建,可视化和编辑了深刻的学习网络。

  1. 基本的R-CNN模型开始与预训练网络。最后三个分类层被替换为特定于您要检测的对象类新的层次。

    有关如何创建R-CNN对象检测网络的示例,请参见创建R-CNN对象检测网络

  2. 快速R-CNN模型建立在基本的R-CNN模型上。通过学习一组box的偏移量,增加box的regression layer来改善图像中对象的位置。在网络中插入一个ROI池层,将每个区域的CNN特性进行池化。

    有关如何创建快速R-CNN对象检测网络的示例,请参见创建快速R-CNN目标检测网络

  3. 更快的R-CNN模型建立在快速R-CNN模型。的区域的建议网络被添加到产生的区域的建议,而不是从外部算法得到的建议。

    有关如何创建更快的R-CNN对象检测网络的示例,请参见创建更快的R-CNN对象检测网络

标记深度学习的培训数据

你可以使用图片标志,贴标签机视频,或地面实况贴标签机(可在自动驾驶工具箱™)应用程序,以交互标签像素和出口标签数据培训。这些应用程序还可以用于标记感兴趣的矩形区域(ROIs)用于对象检测,用于图像分类的场景标签,以及用于语义分割的像素。

参考

[1] Zitnick,C.劳伦斯和P.美元。“边缘框:从边缘目标定位的建议。”计算机视觉ECCV。施普林格国际出版。页391 - 4050。2014.

[2] Girshick, R., J. Donahue, T. Darrell,和J. Malik。丰富的特征层次结构,用于精确的目标检测和语义分割。CVPR '14计算机视觉与模式识别2014年IEEE会议论文集。页580-587。2014

[3] Girshick,罗斯。“快R-CNN”。IEEE计算机视觉国际会议论文集。2015年

任,邵青,何凯明,罗斯·格什克,孙健。更快的R-CNN:使用区域建议网络实现实时目标检测。神经信息处理系统的进展。28日,2015卷。

另请参阅

应用程序

功能

相关的例子

更多关于