对象检测

使用卷积神经网络(cnn或ConvNets)执行分类，目标检测，迁移学习，创建定制的检测器

物体检测是一种计算机视觉技术，用于定位图像或视频中的物体实例。目标检测算法通常利用机器学习或深度学习产生有意义的结果。在观看图像或视频时，人类可以在瞬间识别和定位感兴趣的物体。物体检测的目标是用计算机复制这种智能。对象检测的最佳方法取决于您的应用程序和您试图解决的问题。

深度学习技术需要大量的标记训练图像，因此建议使用GPU来减少训练模型所需的时间。基于深度学习的目标检测方法使用卷积神经网络(cnn或ConvNets)，如R-CNN和YOLO，或使用单次检测(SSD)。您可以训练一个自定义的对象检测器，或者使用一个预先训练好的对象检测器转移学习，这种方法使您能够从预先训练好的网络开始，然后根据应用程序对其进行微调。卷积神经网络需要深度学习工具箱™。CUDA支持训练和预测金宝app^®有能力的GPU。建议使用GPU，并需要并行计算工具箱™。有关更多信息，请参见计算机视觉工具箱参数设置而且MathWorks产品中的并行计算支持金宝app下载188bet金宝搏(并行计算工具箱)．

用于目标检测的机器学习技术包括聚合通道特征(ACF)，使用面向梯度(HOG)特征直方图的支持向量机(SVM)分类，以及用于人脸或上半身检测的Viola-Jones算法。金宝app您可以选择从预先训练好的对象检测器开始，也可以创建适合您的应用程序的自定义对象检测器。

应用程序

图片标志	用于计算机视觉应用的标签图像
贴标签机视频	用于计算机视觉应用的标签视频

功能

全部展开

检测对象

深度学习检测器

`rcnnObjectDetector`	使用R-CNN深度学习检测器检测对象
`fastRCNNObjectDetector`	使用Fast R-CNN深度学习检测器检测对象
`fasterRCNNObjectDetector`	使用Faster R-CNN深度学习检测器检测对象
`ssdObjectDetector`	使用SSD深度学习检测器检测对象
`yolov2ObjectDetector`	使用YOLO v2对象检测器检测对象
`yolov3ObjectDetector`	使用YOLO v3对象检测器检测对象
`yolov4ObjectDetector`	使用YOLO v4对象检测器检测对象
`maskrcnn`	使用掩码R-CNN实例分割检测对象

基于功能的探测器

`光学字符识别`	使用光学字符识别识别文本
`readAprilTag`	检测和估计图像中的AprilTag的姿势
`readBarcode`	检测和解码图像中的一维或二维条码
`acfObjectDetector`	使用聚合通道特性检测对象
`peopleDetectorACF`	使用聚合通道特性检测人员
`愿景。CascadeObjectDetector`	使用Viola-Jones算法检测对象
`愿景。ForegroundDetector`	前景检测使用高斯混合模型
`愿景。PeopleDetector`	使用HOG特征检测正直的人
`愿景。BlobAnalysis`	连通区域的性质

使用点特征检测对象

`detectBRISKFeatures`	检测BRISK特征并返回`BRISKPoints`对象
`detectFASTFeatures`	使用FAST算法检测拐角并返回`cornerPoints`对象
`detectHarrisFeatures`	使用哈里斯-斯蒂芬斯算法检测拐角并返回`cornerPoints`对象
`detectKAZEFeatures`	检测KAZE特征并返回`KAZEPoints`对象
`detectMinEigenFeatures`	利用最小特征值算法检测拐角并返回`cornerPoints`对象
`detectMSERFeatures`	检测MSER特征并返回`MSERRegions`对象
`detectORBFeatures`	检测ORB关键点并返回`ORBPoints`对象
`detectSIFTFeatures`	检测尺度不变特征变换(SIFT)特征并返回`SIFTPoints`对象
`detectSURFFeatures`	检测SURF特征并返回`SURFPoints`对象
`extractFeatures`	提取兴趣点描述符
`matchFeatures`	找到匹配的特征

选择检测对象

`selectStrongestBbox`	从重叠的集群中选择最强的包围框
`selectStrongestBboxMulticlass`	从重叠的集群中选择最强的多类包围框

训练自定义对象检测器

负荷训练数据

`boxLabelDatastore`	边界框标签数据的数据存储
`groundTruth`	地面真值标签数据
`imageDatastore`	图像数据的数据存储
`objectDetectorTrainingData`	创建对象检测器的训练数据
`结合`	组合来自多个数据存储的数据

训练基于特征的对象检测器

`trainACFObjectDetector`	训练ACF对象检测器
`trainCascadeObjectDetector`	训练级联对象检测器模型
`trainImageCategoryClassifier`	训练一个图像分类器

训练基于深度学习的对象检测器

`trainRCNNObjectDetector`	训练一个R-CNN深度学习对象检测器
`trainFastRCNNObjectDetector`	训练一个快速R-CNN深度学习对象检测器
`trainFasterRCNNObjectDetector`	训练一个更快的R-CNN深度学习对象检测器
`trainSSDObjectDetector`	训练SSD深度学习对象检测器
`trainYOLOv2ObjectDetector`	训练YOLO v2对象检测器
`trainYOLOv4ObjectDetector`	训练YOLO v4对象检测器
`trainMaskRCNN`	训练Mask R-CNN网络进行实例分割

增强和预处理深度学习训练数据

`balanceBoxLabels`	平衡包围框标签用于对象检测
`bboxcrop`	裁剪边框
`bboxerase`	移除包围框
`bboxresize`	调整边界框大小
`bboxwarp`	对包围框应用几何变换
`bbox2points`	转换矩形到角点列表
`imwarp`	应用几何变换图像
`imcrop`	作物图像
`imresize`	调整图像
`randomAffine2d`	创建随机2-D仿射变换
`centerCropWindow2d`	创建矩形中心裁剪窗口
`randomWindow2d`	在图像中随机选择矩形区域
`integralImage`	计算二维积分图像

设计目标检测深度神经网络

R-CNN(卷积神经网络区域)

`rcnnBoxRegressionLayer`	快速和快速R-CNN的盒回归层
`fasterRCNNLayers`	创建一个更快的R-CNN对象检测网络
`rpnSoftmaxLayer`	用于区域提议网络(RPN)的Softmax层
`rpnClassificationLayer`	区域提议网络的分类层
`regionProposalLayer`	区域建议层的更快R-CNN
`roiAlignLayer`	Mask-CNN的非量化ROI池化层
`roiInputLayer`	快速R-CNN的ROI输入层
`roiMaxPooling2dLayer`	神经网络层用于输出矩形roi的固定尺寸特征图
`roialign`	的非量化ROI池`dlarray`数据

YOLO v2(你只看一次版本2)

`yolov2Layers`	创建YOLO v2对象检测网络
`yolov2TransformLayer`	为YOLO v2对象检测网络创建转换层
`yolov2OutputLayer`	为YOLO v2对象检测网络创建输出层
`yolov2ReorgLayer`	(不推荐)为YOLO v2对象检测网络创建重组层
`spaceToDepthLayer`	空间到深度层

焦点损失层

`focalLossLayer`	使用焦损函数创建焦损层
`focalCrossEntropy`	计算焦点交叉熵损失

SSD (Single Shot Detector)

ssdMergeLayer 创建SSD合并层用于对象检测

锚箱

estimateAnchorBoxes 估计深度学习对象检测器的锚框

可视化检测结果

`insertObjectAnnotation`	注释真彩色或灰度图像或视频流
`insertObjectMask`	在图像或视频流中插入掩码
`insertShape`	在图像或视频中插入形状
`showShape`	在图像、视频或点云上显示形状

评估检测结果

`evaluateDetectionAOS`	评估目标检测的平均方向相似度度量
`evaluateDetectionMissRate`	评估目标检测的漏失率指标
`evaluateDetectionPrecision`	评估目标检测的精度度量
`bboxOverlapRatio`	计算包围框重叠率
`bboxPrecisionRecall`	计算边界框精度和针对地面真实值的召回

块

深度学习对象检测器

使用训练有素的深度学习对象检测器检测对象

主题

开始

开始使用深度学习进行对象检测
利用深度学习神经网络进行目标检测。
点特征类型
为几种类型的特征选择返回和接受点对象的函数
坐标系统
指定像素指数、空间坐标和3-D坐标系
局部特征检测与提取
学习局部特征检测和提取的优点和应用。
图像分类与视觉词袋
使用计算机视觉工具箱™功能，通过创建一袋视觉词来进行图像类别分类。
开始级联对象检测器
训练自定义分类器
选择函数来可视化检测到的对象
比较可视化功能。

目标检测和语义分割的训练数据

开始使用图像标签器
交互式地标记矩形roi用于对象检测，像素用于语义分割，多边形用于实例分割，场景用于图像分类。
开始与视频标签
交互式地标记矩形roi用于对象检测，像素用于语义分割，多边形用于实例分割，场景用于视频或图像序列中的图像分类。
用于深度学习的数据存储(深度学习工具箱)
了解如何在深度学习应用程序中使用数据存储。
开始使用掩码R-CNN进行实例分割
使用Mask R-CNN和深度学习进行多类实例分割。
目标检测和语义分割的训练数据
创建用于对象检测或语义分割的训练数据图片标志或贴标签机视频．

从深度学习开始

深度网络设计器(深度学习工具箱)
深度学习层列表(深度学习工具箱)
在MATLAB中发现所有深度学习层^®．
MATLAB深度学习(深度学习工具箱)
在MATLAB中使用卷积神经网络进行分类和回归，包括预训练网络和迁移学习，以及在gpu、cpu、集群和云上进行训练，从而发现深度学习功能。
预训练的深度神经网络(深度学习工具箱)
学习如何下载和使用预训练的卷积神经网络进行分类，迁移学习和特征提取。