主要内容

对象检测

使用卷积神经网络(CNNs,或ConvNets)进行分类、目标检测、迁移学习,创建定制的检测器

目标检测是一种用于定位图像或视频中物体实例的计算机视觉技术。对象检测算法通常利用机器学习或者深度学习产生有意义的结果。在观看图像或视频时,人们可以在瞬间识别并定位感兴趣的物体。目标探测的目标是用计算机复制这种智能。对象检测的最佳方法取决于您的应用程序和您试图解决的问题。

深度学习技术需要大量标记的训练图像,因此建议使用GPU来减少培训模型所需的时间。基于深度学习的对象检测方法使用卷积神经网络(CNNS或CUMMNET),例如R-CNN和YOLO V2,或使用单次检测(SSD)。您可以通过利用来训练自定义对象探测器,或使用佩带的对象检测器转移学习,这种方法使您能够从预先训练好的网络开始,然后针对您的应用程序对其进行微调。卷积神经网络需要深度学习工具箱™。CUDA支持训练和预测金宝app®有能力的GPU。建议使用GPU,并需要并行计算工具箱™。有关更多信息,请参见计算机视觉工具箱首选项MathWorks产品中的并行计算支持金宝app下载188bet金宝搏(并行计算工具箱)

用于目标检测的机器学习技术包括聚合通道特征(ACF)、使用定向梯度特征直方图(HOG)的支持向量机(SVM)分类,以及用于人脸或上半身检测的Viola-Jones算法。金宝app您可以选择从一个预先训练好的对象检测器开始,或者创建一个自定义的对象检测器来适合您的应用程序。

目标检测,神经网络

应用

图片标志 为计算机视觉应用的标签图像
贴标签机视频 为计算机视觉应用的标签视频

功能

全部展开

深度学习探测器

rcnnobjectdetector. 使用R-CNN深度学习检测器检测对象
fastrcnnobjectdetector 使用快速R-CNN深度学习探测器检测对象
fasterRCNNObjectDetector 使用更快的R-CNN深度学习探测器检测对象
ssdObjectDetector 使用SSD深度学习检测器检测对象
yolov2ObjectDetector 使用YOLO v2对象检测器检测对象
Yolov3objectDetector 创建YOLO V3对象检测器
maskrcnn 使用Mask R-CNN实例分割检测对象

基于功能的探测器

光学字符识别 使用光学字符识别识别文本
Readapriltag. 检测和估计AprilTag在图像中的姿态
readbarcode. 检测和解码图像中的1-D或2-D条形码
acfObjectDetector 使用聚合通道特性检测对象
Peopledetectoracf. 使用聚合通道功能检测人员
愿景。CascadeObjectDetector 使用Viola-Jones算法检测目标
Vision.ForeCroundDetector. 使用高斯混合模型的前景检测
Vision.Peopledetector 使用HOG特征检测直立的人
愿景。BlobAnalysis 连通区域的性质

使用点特征检测对象

detectBRISKFeatures 检测轻快特征和返回BRISKPoints对象
检测到空间 使用快速算法检测角落并返回cornerPoints对象
detectHarrisFeatures 使用Harris-Stephens算法检测角点并返回cornerPoints对象
detectKAZEFeatures 检测Kaze功能并返回KAZEPoints对象
detectMinEigenFeatures 用最小特征值算法检测角点并返回cornerPoints对象
detectMSERFeatures 检测MSER功能并返回MSERREGIONS.对象
探测器 检测ORB关键点并返回orbpoints.对象
检测活动 检测比例不变功能转换(SIFT)功能并返回SIFTPoints对象
探测器拍摄 检测SURF特征并返回SURFPoints对象
extractFeatures 提取兴趣点描述符
matchFeatures 找到匹配的特性

选择检测到的对象

Selectstrontestbbox. 从重叠群集中选择最强定的边界框
selectStrongestBboxMulticlass 从重叠的簇中选择最强的多类包围框

负荷训练数据

boxLabelDatastore 用于边界框标签数据的数据存储
groundTruth 地面真值标记数据
imageDatastore 图像数据的数据存储
objectDetectorTrainingData 为目标检测器创建训练数据
结合 合并来自多个数据存储的数据

训练基于特征的目标检测器

trainacfobjectdetector 火车ACF对象探测器
trainCascadeObjectDetector 训练级联对象检测器模型
TrainimageCategoryClassifier 训练一个图像分类器

训练基于深度学习的目标检测器

trainrcnnobjectdetector 培训R-CNN深度学习对象探测器
trainFastRCNNObjectDetector 训练一个快速的R-CNN深度学习对象检测器
trainFasterRCNNObjectDetector 培训更快的R-CNN深度学习对象探测器
trainSSDObjectDetector 训练SSD深度学习对象检测器
trainYOLOv2ObjectDetector 火车yolo v2对象探测器

深度学习的增强和预处理培训数据

balanceBoxLabels 平衡包围盒标签用于对象检测
bboxcrop 作物边界框
bboxerase 消除边界框
bboxresize 调整边界框
bboxwarp 对边界框应用几何变换
bbox2points 转换矩形到角点列表
imwarp 将几何变换应用于图像
imcrop 裁剪
imresize 调整图像大小
randomAffine2d 创建随机的二维仿射变换
centerCropWindow2d 创建矩形中心裁剪窗口
randomwindow2d. 在图像中随机选择矩形区域
integralImage 计算2-D积分图像

R-CNN(卷积神经网络区域)

rcnnBoxRegressionLayer 快速和更快的R-CNN的框回归层
fasterrcnlayers. 创建一个更快的R-CNN对象检测网络
rpnSoftmaxLayer 区域提案网络(RPN)的Softmax层
rpnClassificationLayer 区域提案网络的分类层(RPN)
regionProposalLayer 区域提议层更快的R-CNN
roialignlayer. Mask-CNN的非量化ROI池层
roiInputLayer 快速R-CNN的ROI输入层
roimaxpooling2dlayer. 用于矩形roi输出固定尺寸特征图的神经网络层
roialign. 非量化的ROI池dlarray数据

YOLO(你只看一次)

yolov2Layers 创建YOLO v2对象检测网络
yolov2TransformLayer 为YOLO v2对象检测网络创建变换层
YOLOV2OUTPUTLAYER. 为YOLO v2对象检测网络创建输出层
yolov2reorglayer. (不推荐)为Yolo V2对象检测网络创建重组层
spacetodepthlayer. 距深层

焦层损失

focalLossLayer 使用焦丢失函数创建焦丢失层
focalCrossEntropy 计算焦点交叉熵损失

SSD(单次检测器)

ssdmergelayer. 创建SSD合并层用于对象检测
ssdlayers. SSD Multibox对象检测网络

锚箱

anchorBoxLayer 创建锚框层用于对象检测
extimateanchorboxes. 评估深度学习对象检测器的锚盒
insertObjectAnnotation 注释真彩色或灰度图像或视频流
insertObjectMask 在图像或视频流中插入掩码
insertShape 在图像或视频中插入形状
showShape 显示图像,视频或点云上的形状
evaluateDetectionAOS 评估对象检测的平均方向相似度量
evaluateDetectionMissRate 评估对象检测的错误率度量
evaluateDetectionPrecision 评估对象检测的精度度量
bboxOverlapRatio 计算边界框重叠率
bboxPrecisionRecall 根据地面真实值计算包围盒精度和召回率

深度学习对象检测器 使用训练有素的深度学习目标检测器检测目标

主题

开始

使用深度学习开始对象检测

利用深度学习神经网络进行目标检测。

点特征类型

选择返回和接受点对象的函数,以获取多种类型的功能

坐标系统

指定像素索引、空间坐标和三维坐标系统

本地特征检测和提取

了解本地特征检测和提取的好处和应用。

基于视觉词袋的图像分类

通过创建一袋视觉单词,使用计算机Vision Toolbox™用于图像类别分类。

开始使用级联对象检测器

训练自定义分类器

选择“功能”以可视化检测到的对象

比较可视化功能。

目标检测和语义分割的训练数据

开始使用图像贴标程序

交互式标记矩形roi用于目标检测,像素用于语义分割,多边形用于实例分割,场景用于图像分类。

开始使用视频标签

交互式标记矩形roi用于目标检测,像素用于语义分割,多边形用于实例分割,场景用于视频或图像序列中的图像分类。

用于深度学习的数据存储(深度学习工具箱)

了解如何在深度学习应用程序中使用数据存储。

开始使用掩码R-CNN进行实例分割

使用Mask R-CNN和深度学习执行多类实例分割。

目标检测和语义分割的训练数据

创建训练数据的对象检测或语义分割使用图片标志或者贴标签机视频

开始深度学习

深层网络设计师(深度学习工具箱)

深度学习层列表(深度学习工具箱)

发现MATLAB中所有的深度学习层®

MATLAB中的深度学习(深度学习工具箱)

利用卷积神经网络进行分类和回归,在MATLAB中发现深度学习能力,包括预训练网络和迁移学习,以及在gpu、cpu、集群和云上的训练。

普里尔的深层神经网络(深度学习工具箱)

学习如何下载和使用预训练的卷积神经网络进行分类、迁移学习和特征提取。

特色的例子