主要内容

对象检测

使用卷积神经网络(CNNs,或ConvNets)进行分类、目标检测、迁移学习,创建定制的检测器

目标检测是一种用于定位图像或视频中物体实例的计算机视觉技术。对象检测算法通常利用机器学习深度学习产生有意义的结果。在观看图像或视频时,人们可以在瞬间识别并定位感兴趣的物体。目标探测的目标是用计算机复制这种智能。对象检测的最佳方法取决于您的应用程序和您试图解决的问题。

深度学习技术需要大量的标记训练图像,因此建议使用GPU来减少训练模型所需的时间。基于深度学习的目标检测方法使用卷积神经网络(cnn或ConvNets),如R-CNN和YOLO v2,或使用单镜头检测(SSD)。您可以训练自定义的对象检测器,或利用预先训练的对象检测器转移学习,这种方法使您能够从预先训练好的网络开始,然后针对您的应用程序对其进行微调。卷积神经网络需要深度学习工具箱™。CUDA支持训练和预测金宝app®有能力的GPU。建议使用GPU,并需要并行计算工具箱™。有关更多信息,请参见计算机视觉工具箱首选项MathWorks产品中的并行计算支持金宝app下载188bet金宝搏(并行计算工具箱)

用于目标检测的机器学习技术包括聚合通道特征(ACF)、使用定向梯度特征直方图(HOG)的支持向量机(SVM)分类,以及用于人脸或上半身检测的Viola-Jones算法。金宝app您可以选择从一个预先训练好的对象检测器开始,或者创建一个自定义的对象检测器来适合您的应用程序。

目标检测,神经网络

应用程序

图片标志 为计算机视觉应用的标签图像
贴标签机视频 为计算机视觉应用的标签视频

功能

全部展开

深度学习探测器

rcnnObjectDetector 使用R-CNN深度学习检测器检测对象
fastRCNNObjectDetector 使用快速R-CNN深度学习检测器检测对象
fasterRCNNObjectDetector 使用更快的R-CNN深度学习检测器检测对象
ssdObjectDetector 使用SSD深度学习检测器检测对象
yolov2ObjectDetector 使用YOLO v2对象检测器检测对象
yolov3ObjectDetector 创建YOLO v3对象检测器
maskrcnn 使用Mask R-CNN实例分割检测对象

基于功能的探测器

光学字符识别 使用光学字符识别识别文本
readAprilTag 检测和估计AprilTag在图像中的姿态
readBarcode 检测和解码图像中的1-D或2-D条形码
acfObjectDetector 使用聚合通道特性检测对象
peopleDetectorACF 使用聚合通道特性检测人员
愿景。CascadeObjectDetector 使用Viola-Jones算法检测目标
愿景。ForegroundDetector 使用高斯混合模型的前景检测
愿景。PeopleDetector 使用HOG特征检测直立的人
愿景。BlobAnalysis 连通区域的性质

使用点特征检测对象

detectBRISKFeatures 检测轻快特征和返回BRISKPoints对象
detectFASTFeatures 使用FAST算法检测角点并返回cornerPoints对象
detectHarrisFeatures 使用Harris-Stephens算法检测角点并返回cornerPoints对象
detectKAZEFeatures 检测KAZE特征并返回KAZEPoints对象
detectMinEigenFeatures 用最小特征值算法检测角点并返回cornerPoints对象
detectMSERFeatures 检测MSER特征并返回MSERRegions对象
detectORBFeatures 检测ORB关键点并返回ORBPoints对象
detectSIFTFeatures 检测尺度不变特征变换(SIFT)特征并返回SIFTPoints对象
detectSURFFeatures 检测SURF特征并返回SURFPoints对象
extractFeatures 提取兴趣点描述符
matchFeatures 找到匹配的特性

选择检测对象

selectStrongestBbox 从重叠的簇中选择最强的包围框
selectStrongestBboxMulticlass 从重叠的簇中选择最强的多类包围框

负荷训练数据

boxLabelDatastore 用于边界框标签数据的数据存储
groundTruth 地面真值标记数据
imageDatastore 用于图像数据的数据存储
objectDetectorTrainingData 为目标检测器创建训练数据
结合 合并来自多个数据存储的数据

训练基于特征的目标检测器

trainACFObjectDetector 训练ACF物体检测器
trainCascadeObjectDetector 训练级联对象检测器模型
trainImageCategoryClassifier 训练一个图像分类器

训练基于深度学习的目标检测器

trainRCNNObjectDetector 训练R-CNN深度学习目标检测器
trainFastRCNNObjectDetector 训练一个快速的R-CNN深度学习对象检测器
trainFasterRCNNObjectDetector 训练一个更快的R-CNN深度学习对象检测器
trainSSDObjectDetector 训练SSD深度学习对象检测器
trainYOLOv2ObjectDetector 火车YOLO v2物体探测器

为深度学习增加和预处理训练数据

balanceBoxLabels 平衡包围盒标签用于对象检测
bboxcrop 作物边界框
bboxerase 消除边界框
bboxresize 调整边界框
bboxwarp 对边界框应用几何变换
bbox2points 转换矩形到角点列表
imwarp 对图像应用几何变换
imcrop 作物图像
imresize 调整图像
randomAffine2d 创建随机的二维仿射变换
centerCropWindow2d 创建矩形中心裁剪窗口
randomWindow2d 在图像中随机选择矩形区域
integralImage 计算二维积分图像

R-CNN(卷积神经网络区域)

rcnnBoxRegressionLayer 盒回归层快速和更快的R-CNN
fasterRCNNLayers 创建一个更快的R-CNN对象检测网络
rpnSoftmaxLayer 区域提议网(RPN)软max层
rpnClassificationLayer 区域提议网络分类层
regionProposalLayer 区域提议层更快的R-CNN
roiAlignLayer Mask-CNN的非量化ROI池层
roiInputLayer 快速R-CNN的ROI输入层
roiMaxPooling2dLayer 用于矩形roi输出固定尺寸特征图的神经网络层
roialign 非量化的ROI池dlarray数据

你只看一次

yolov2Layers 创建YOLO v2对象检测网络
yolov2TransformLayer 为YOLO v2对象检测网络创建变换层
yolov2OutputLayer 为YOLO v2对象检测网络创建输出层
yolov2ReorgLayer (不推荐)为YOLO v2对象检测网络创建重组层
spaceToDepthLayer 距深层

焦层损失

focalLossLayer 使用焦丢失函数创建焦丢失层
focalCrossEntropy 计算焦点交叉熵损失

SSD(单针探测器)

ssdMergeLayer 创建SSD合并层用于对象检测
ssdLayers SSD多盒对象检测网络

锚箱

anchorBoxLayer 创建锚框层用于对象检测
estimateAnchorBoxes 评估深度学习对象检测器的锚盒
insertObjectAnnotation 注释真彩色或灰度图像或视频流
insertObjectMask 在图像或视频流中插入掩码
insertShape 在图像或视频中插入形状
showShape 在图像、视频或点云上显示形状
evaluateDetectionAOS 评估目标检测的平均方向相似度度量
evaluateDetectionMissRate 评估目标检测的缺失率度量
evaluateDetectionPrecision 评估目标检测的精度度量
bboxOverlapRatio 计算边界框重叠率
bboxPrecisionRecall 根据地面真实值计算包围盒精度和召回率

深度学习对象检测器 使用训练有素的深度学习目标检测器检测目标

主题

开始

开始使用深度学习的对象检测

利用深度学习神经网络进行目标检测。

点特征类型

为几种类型的特性选择返回和接受点对象的函数

坐标系统

指定像素索引、空间坐标和三维坐标系统

局部特征检测与提取

学习局部特征检测和提取的好处和应用。

基于视觉词袋的图像分类

使用计算机视觉工具箱™功能,通过创建一个视觉词汇袋来进行图像类别分类。

开始使用级联对象检测器

训练自定义分类器

选择“功能”以可视化检测到的对象

比较可视化功能。

目标检测和语义分割的训练数据

开始使用图像标签

交互式标记矩形roi用于目标检测,像素用于语义分割,多边形用于实例分割,场景用于图像分类。

开始使用视频标签

交互式标记矩形roi用于目标检测,像素用于语义分割,多边形用于实例分割,场景用于视频或图像序列中的图像分类。

用于深度学习的数据存储(深度学习工具箱)

学习如何在深度学习应用程序中使用数据存储。

开始使用掩码R-CNN进行实例分割

使用Mask R-CNN和深度学习执行多类实例分割。

目标检测和语义分割的训练数据

创建训练数据的对象检测或语义分割使用图片标志贴标签机视频

开始深度学习

深层网络设计师(深度学习工具箱)

深度学习层列表(深度学习工具箱)

发现MATLAB中所有的深度学习层®

MATLAB中的深度学习(深度学习工具箱)

利用卷积神经网络进行分类和回归,在MATLAB中发现深度学习能力,包括预训练网络和迁移学习,以及在gpu、cpu、集群和云上的训练。

预先训练的深度神经网络(深度学习工具箱)

学习如何下载和使用预训练的卷积神经网络进行分类、迁移学习和特征提取。

特色的例子