主要内容

对象检测

使用卷积神经网络(cnn或ConvNets)执行分类,目标检测,迁移学习,创建定制的检测器

物体检测是一种计算机视觉技术,用于定位图像或视频中的物体实例。目标检测算法通常利用机器学习深度学习产生有意义的结果。在观看图像或视频时,人类可以在瞬间识别和定位感兴趣的物体。物体检测的目标是用计算机复制这种智能。对象检测的最佳方法取决于您的应用程序和您试图解决的问题。

深度学习技术需要大量的标记训练图像,因此建议使用GPU来减少训练模型所需的时间。基于深度学习的目标检测方法使用卷积神经网络(cnn或ConvNets),如R-CNN和YOLO,或使用单次检测(SSD)。您可以训练一个自定义的对象检测器,或者使用一个预先训练好的对象检测器转移学习,这种方法使您能够从预先训练好的网络开始,然后根据应用程序对其进行微调。卷积神经网络需要深度学习工具箱™。CUDA支持训练和预测金宝app®有能力的GPU。建议使用GPU,并需要并行计算工具箱™。有关更多信息,请参见计算机视觉工具箱参数设置而且MathWorks产品中的并行计算支持金宝app下载188bet金宝搏(并行计算工具箱)

用于目标检测的机器学习技术包括聚合通道特征(ACF),使用面向梯度(HOG)特征直方图的支持向量机(SVM)分类,以及用于人脸或上半身检测的Viola-Jones算法。金宝app您可以选择从预先训练好的对象检测器开始,也可以创建适合您的应用程序的自定义对象检测器。

目标检测,神经网络

应用程序

图片标志 用于计算机视觉应用的标签图像
贴标签机视频 用于计算机视觉应用的标签视频

功能

全部展开

深度学习检测器

rcnnObjectDetector 使用R-CNN深度学习检测器检测对象
fastRCNNObjectDetector 使用Fast R-CNN深度学习检测器检测对象
fasterRCNNObjectDetector 使用Faster R-CNN深度学习检测器检测对象
ssdObjectDetector 使用SSD深度学习检测器检测对象
yolov2ObjectDetector 使用YOLO v2对象检测器检测对象
yolov3ObjectDetector 使用YOLO v3对象检测器检测对象
yolov4ObjectDetector 使用YOLO v4对象检测器检测对象
maskrcnn 使用掩码R-CNN实例分割检测对象

基于功能的探测器

光学字符识别 使用光学字符识别识别文本
readAprilTag 检测和估计图像中的AprilTag的姿势
readBarcode 检测和解码图像中的一维或二维条码
acfObjectDetector 使用聚合通道特性检测对象
peopleDetectorACF 使用聚合通道特性检测人员
愿景。CascadeObjectDetector 使用Viola-Jones算法检测对象
愿景。ForegroundDetector 前景检测使用高斯混合模型
愿景。PeopleDetector 使用HOG特征检测正直的人
愿景。BlobAnalysis 连通区域的性质

使用点特征检测对象

detectBRISKFeatures 检测BRISK特征并返回BRISKPoints对象
detectFASTFeatures 使用FAST算法检测拐角并返回cornerPoints对象
detectHarrisFeatures 使用哈里斯-斯蒂芬斯算法检测拐角并返回cornerPoints对象
detectKAZEFeatures 检测KAZE特征并返回KAZEPoints对象
detectMinEigenFeatures 利用最小特征值算法检测拐角并返回cornerPoints对象
detectMSERFeatures 检测MSER特征并返回MSERRegions对象
detectORBFeatures 检测ORB关键点并返回ORBPoints对象
detectSIFTFeatures 检测尺度不变特征变换(SIFT)特征并返回SIFTPoints对象
detectSURFFeatures 检测SURF特征并返回SURFPoints对象
extractFeatures 提取兴趣点描述符
matchFeatures 找到匹配的特征

选择检测对象

selectStrongestBbox 从重叠的集群中选择最强的包围框
selectStrongestBboxMulticlass 从重叠的集群中选择最强的多类包围框

负荷训练数据

boxLabelDatastore 边界框标签数据的数据存储
groundTruth 地面真值标签数据
imageDatastore 图像数据的数据存储
objectDetectorTrainingData 创建对象检测器的训练数据
结合 组合来自多个数据存储的数据

训练基于特征的对象检测器

trainACFObjectDetector 训练ACF对象检测器
trainCascadeObjectDetector 训练级联对象检测器模型
trainImageCategoryClassifier 训练一个图像分类器

训练基于深度学习的对象检测器

trainRCNNObjectDetector 训练一个R-CNN深度学习对象检测器
trainFastRCNNObjectDetector 训练一个快速R-CNN深度学习对象检测器
trainFasterRCNNObjectDetector 训练一个更快的R-CNN深度学习对象检测器
trainSSDObjectDetector 训练SSD深度学习对象检测器
trainYOLOv2ObjectDetector 训练YOLO v2对象检测器
trainYOLOv4ObjectDetector 训练YOLO v4对象检测器
trainMaskRCNN 训练Mask R-CNN网络进行实例分割

增强和预处理深度学习训练数据

balanceBoxLabels 平衡包围框标签用于对象检测
bboxcrop 裁剪边框
bboxerase 移除包围框
bboxresize 调整边界框大小
bboxwarp 对包围框应用几何变换
bbox2points 转换矩形到角点列表
imwarp 应用几何变换图像
imcrop 作物图像
imresize 调整图像
randomAffine2d 创建随机2-D仿射变换
centerCropWindow2d 创建矩形中心裁剪窗口
randomWindow2d 在图像中随机选择矩形区域
integralImage 计算二维积分图像

R-CNN(卷积神经网络区域)

rcnnBoxRegressionLayer 快速和快速R-CNN的盒回归层
fasterRCNNLayers 创建一个更快的R-CNN对象检测网络
rpnSoftmaxLayer 用于区域提议网络(RPN)的Softmax层
rpnClassificationLayer 区域提议网络的分类层
regionProposalLayer 区域建议层的更快R-CNN
roiAlignLayer Mask-CNN的非量化ROI池化层
roiInputLayer 快速R-CNN的ROI输入层
roiMaxPooling2dLayer 神经网络层用于输出矩形roi的固定尺寸特征图
roialign 的非量化ROI池dlarray数据

YOLO v2(你只看一次版本2)

yolov2Layers 创建YOLO v2对象检测网络
yolov2TransformLayer 为YOLO v2对象检测网络创建转换层
yolov2OutputLayer 为YOLO v2对象检测网络创建输出层
yolov2ReorgLayer (不推荐)为YOLO v2对象检测网络创建重组层
spaceToDepthLayer 空间到深度层

焦点损失层

focalLossLayer 使用焦损函数创建焦损层
focalCrossEntropy 计算焦点交叉熵损失

SSD (Single Shot Detector)

ssdMergeLayer 创建SSD合并层用于对象检测

锚箱

estimateAnchorBoxes 估计深度学习对象检测器的锚框
insertObjectAnnotation 注释真彩色或灰度图像或视频流
insertObjectMask 在图像或视频流中插入掩码
insertShape 在图像或视频中插入形状
showShape 在图像、视频或点云上显示形状
evaluateDetectionAOS 评估目标检测的平均方向相似度度量
evaluateDetectionMissRate 评估目标检测的漏失率指标
evaluateDetectionPrecision 评估目标检测的精度度量
bboxOverlapRatio 计算包围框重叠率
bboxPrecisionRecall 计算边界框精度和针对地面真实值的召回

深度学习对象检测器 使用训练有素的深度学习对象检测器检测对象

主题

开始

目标检测和语义分割的训练数据

从深度学习开始

  • 深度网络设计器(深度学习工具箱)
  • 深度学习层列表(深度学习工具箱)
    在MATLAB中发现所有深度学习层®
  • MATLAB深度学习(深度学习工具箱)
    在MATLAB中使用卷积神经网络进行分类和回归,包括预训练网络和迁移学习,以及在gpu、cpu、集群和云上进行训练,从而发现深度学习功能。
  • 预训练的深度神经网络(深度学习工具箱)
    学习如何下载和使用预训练的卷积神经网络进行分类,迁移学习和特征提取。