愿景。CascadeObjectDetector

使用Viola-Jones算法检测目标

展开所有页面

描述

级联对象检测器使用Viola-Jones算法来检测人脸、鼻子、眼睛、嘴巴或上半身。你也可以用the图片标志培训自定义分类器以与此系统对象一起使用。有关函数如何工作的详细信息，请参阅开始使用级联对象检测器．

在图像中检测面部特征或上半身:

创建愿景。CascadeObjectDetector对象并设置其属性。
用参数调用对象，就像它是一个函数一样。

要了解更多关于System对象如何工作的信息，请参见什么是系统对象？

创建

语法

探测器= Vision.cascadeObjectDetector

探测器= vision.CascadeObjectDetector(模型)

探测器= Vision.cascadeObjectDetector（XMLFile）

探测器= vision.CascadeObjectDetector(名称、值)

描述

例子

探测器=愿景。CascadeObjectDetector创建探测器以使用Viola-Jones算法检测对象。

探测器= Vision.cascadeObjectDetector（模型）创建检测器，该检测器被配置为检测输入字符向量定义的对象，模型．

探测器= Vision.cascadeObjectDetector（XMLFILE）属性指定的自定义分类模型创建检测器并将其配置为使用XMLFILE输入。

探测器= Vision.cascadeObjectDetector（名称,值）使用一个或多个名称-值对设置属性。将每个属性名用引号括起来。例如,Detector = Vision.cascadeObjectDetector（'ClassificationModel'，'upperbaly'）

特性

展开全部

除非另有说明，否则属性是nontunable，这意味着您不能在调用对象之后更改它们的值。对象在调用时锁定，而释放函数打开它们。

如果属性是调节，您可以随时更改它的值。

有关更改属性值的详细信息，请参阅在MATLAB中使用系统对象进行系统设计．

`ClassificationModel`- - - - - -训练级联分类模型
`“FrontalFaceCART”`（默认）|`字符串`

训练的级联分类模型，指定为字符向量。的ClassificationModel属性控制要检测的对象类型。缺省情况下，该检测器用于检测人脸。

您可以将此字符向量设置为包含自定义分类模型的XML文件，或者到下面列出的有效模型字符向量之一。您可以使用培训自定义分类模型trainCascadeObjectDetector函数。该函数可以使用haar类特征、定向梯度直方图(HOG)或局部二值模式(LBP)来训练模型。该功能的使用方法请参见开始使用级联对象检测器．

分类模型	图像尺寸用于训练模型	模型描述
`“FrontalFaceCART”`（默认）	20 [20]	检测垂直和向前的脸。该模型由弱分类器组成，基于分类与回归树分析(CART)。这些分类器使用Haar特征对面部特征进行编码。基于cart的分类器提供了建模人脸特征之间高阶依赖关系的能力。［1］
`“FrontalFaceLBP”`	24 (24)	检测垂直和向前的脸。该模型基于一个决策残桩，由弱分类器组成。这些分类器使用局部二值模式(LBP)对面部特征进行编码。LBP特征对光照变化具有鲁棒性。［2］
`'上半身'`	(18 22)	检测上半身区域，这被定义为头部和肩部区域。该模型利用Haar特征对头部和肩部区域的细节进行编码。因为它在头部周围使用了更多的特征，这个模型对姿势的变化更健壮，例如头部旋转/倾斜。［3］
`“EyePairBig”` `'eyepairemall'`	45 [11] [5 22]	探测一对眼睛。的`'eyepairemall'`模型使用较小的图像训练。这使模型能够检测较小的眼睛`“EyePairBig”`可以检测模型。［4］
`'左眼'` `'右眼'`	18 [12]	分别检测左右眼。这些模型由基于决策残桩的弱分类器组成。这些分类器使用Haar特性对细节进行编码。［4］
`“LeftEyeCART”` `'righteyecart'`	20 [20]	分别检测左右眼。构成这些模型的弱分类器是cart树。与决策树桩相比，基于cart树的分类器能够更好地建模高阶依赖关系。［5］
`“ProfileFace”`	20 [20]	检测直立的面部轮廓。该模型基于一个决策残桩，由弱分类器组成。这些分类器使用Haar特征对脸部细节进行编码。
`“口”`	[15 25]	检测到嘴。该模型由基于决策残桩的弱分类器组成，利用哈尔特征对嘴巴细节进行编码。［4］
`“鼻子”`	(15 18)	该模型由基于决策树桩的弱分类器组成，该分类器使用HAAR功能来编码鼻细节。［4］

`MinSize`- - - - - -最小可探测物体的尺寸
`［］`（默认）|双元素矢量

最小可探测物体的大小，指定为二元矢量[高度宽度］．将此属性设置为包含对象的最小大小区域的像素。该值必须大于或等于用于训练模型的图像大小。当您在处理图像之前知道最小对象大小时，使用此属性可减少计算时间。当您没有为该属性指定值时，检测器将其设置为用于训练分类模型的图像的大小。

有关解释设置可检测对象的大小与尺寸之间的关系ScaleFactor财产，参见算法部分。

可调:是的

`最大限度`- - - - - -最大可探测物体的大小
`［］`（默认）|双元素矢量

可探测物体的最大尺寸，指定为二元矢量[高度宽度］．指定要检测的最大对象的像素大小。当您在处理图像之前知道最大对象大小时，使用此属性可减少计算时间。当您没有为该属性指定值时，检测器将其设置为大小（我）.

有关解释设置可检测对象的大小与尺寸之间的关系ScaleFactor财产，见算法部分。

`ScaleFactor`- - - - - -用于多尺度目标检测的缩放
`1．1`（默认）|标量

用于多尺度对象检测的缩放，指定值大于1.0001．尺度因子递增地缩放之间的检测分辨率MinSize和最大限度．你可以使用以下方法将比例系数设置为一个理想值:

大小（我) / (大小（我）-0.5）

检测器以中间的增量缩放搜索区域MinSize和最大限度使用以下关系：

搜索区域＝轮（(培训规模）*（ScaleFactor^N）)

N当前增量是大于零的整数吗培训规模是用于培训分类模型的图像尺寸。

可调:是的

`mergethreshold.`- - - - - -检测阈值
`4`（默认）|整数

检测阈值，整数形式。阈值定义了在一个对象周围有多个检测的区域中声明最终检测所需的标准。满足阈值的一组并置检测被合并，在目标物体周围产生一个边界框。增加这个阈值可以通过要求目标对象在多尺度检测阶段被多次检测来帮助抑制错误检测。当您将此属性设置为0，返回所有检测而不执行阈值处理或合并操作。此属性可调整。

`UseROI`- - - - - -利用兴趣区域
`假`（默认）|`真正的`

使用感兴趣的区域，指定为假或者真正的．将此属性设置为真正的检测输入图像中感兴趣的矩形区域内的目标。

使用

语法

bbox =探测器（i）

bbox =检测器(roi),我

描述

bbox.=探测器(我）返回一个米4矩阵,bbox.，定义米包含被检测对象的包围盒。检测器对输入图像进行多尺度目标检测，我．

bbox.=探测器(我，roi）在指定的矩形搜索区域内检测对象roi．设置'useroi'财产真正的使用此语法。

输入参数

展开全部

`我`- - - - - -输入图像
灰度|真彩(RGB)

输入图像，指定为灰度或TrueColor（RGB）。

`模型`- - - - - -分类模型
`“FrontalFaceCART”`（默认）|`字符串`

分类模型，指定为字符向量。的模型输入描述要检测的对象类型。有几个有效的模型字符向量，如'Frontalfacecart.”、“上半身'，和 'professface.＇.看到ClassificationModel可用模型的完整列表的属性描述。

`XMLFILE`- - - - - -自定义分类模型
XML文件

自定义分类模型，指定为XML文件。的XMLFILE可以使用使用trainCascadeObjectDetector函数或OpenCV(开源计算机视觉)训练功能。的完整路径或相对路径XMLFILE，如果不是在MATLAB中^®小路。

`roi`- - - - - -矩形的兴趣区域
研制出向量（默认）

图像内感兴趣的矩形区域我，指定为四元素矢量，[xy宽度高度］．

输出参数

展开全部

`bbox.`——检测
米-By-4矩阵（默认）

检测，返回为米4元素的矩阵。输出矩阵的每一行包含一个四个元素的向量，[xy宽度高度，它以像素、左上角和边界框的大小指定。

对象的功能

要使用对象函数，请指定System对象™作为第一个输入参数。例如，释放名为system的对象的系统资源obj，使用下面的语法:

发行版(obj)

展开全部

所有系统对象都是通用的

`步`	跑系统对象算法
`释放`	释放资源并允许更改系统对象属性值和输入特征
`重置`	使内部状态复位系统对象

例子

全部折叠

使用正面人脸分类模型检测图像中的人脸

打开生活的脚本

创建一个人脸检测器对象。

faceDetector = vision.CascadeObjectDetector;

读取输入图像。

我= imread（'Visionteam.jpg'）;

检测的面孔。

bboxes = faceDetector(我);

注释检测到的面部。

ifaces = InsertObjectAnnotation（i，“矩形”bboxes,'脸'）;图imshow（ifaces）标题（检测到人脸的）;

图中包含一个轴对象。标题为“检测到的面”的轴对象包含一个类型为image的对象。

利用上体分类模型检测图像中的上体

打开生活的脚本

创建身体检测器对象并设置属性。

BodyDetector = Vision.cascadeObjectDetector（'上半身'）;bodyDetector。MinSize＝[60 60]; bodyDetector.MergeThreshold = 10;

读取输入图像并检测上半身。

I2 = imread ('Visionteam.jpg'）;bboxBody = bodyDetector (I2);

注释检测到的上体。

IBody = insertObjectAnnotation (I2,“矩形”bboxBody,'上半身'）;图imshow (IBody)标题('检测到上半身'）;

图中包含一个轴对象。标题为“检测到的上体”的轴对象包含类型为image的对象。

算法

展开全部

分类模型的训练

每个模型都经过训练，以检测特定类型的对象。分类模型是通过从一组已知图像中提取特征来训练的。然后将这些提取的特征输入到学习算法中来训练分类模型。计算机视觉工具箱™软件使用Viola-Jones级联对象检测器。这个探测器使用HOG［7］，LBP.［8］, Haar-like［6］特征和使用增强训练的分类器级联。

用于训练分类器的图像大小定义了包含目标的最小区域。训练图像的大小根据应用、目标对象的类型和可用的正图像而异。你必须设置MinSize属性设置为大于或等于用于训练模型的图像大小的值。

级联分类器

该对象使用级联分类器有效地处理图像区域的存在的目标对象。级联中的每个阶段都应用越来越复杂的二值分类器，这使得算法能够快速剔除不包含目标的区域。如果在级联的任何阶段都没有找到所需的对象，探测器立即拒绝该区域并终止处理。通过终止，对象避免了进一步调用级联中计算密集型的分类器。

多尺度对象检测

检测器递增地将输入图像缩放以定位目标对象。在每个比例递增时，其大小与训练图像大小相同的滑动窗口扫描缩放图像以定位对象。的ScaleFactor属性确定连续增量之间的伸缩量。

搜索区域的大小与搜索区域的大小有关ScaleFactor以下列方式:

搜索区域＝轮（(objectTrapingsize.）*（ScaleFactor^N）)

N当前增量是大于零的整数吗objectTrapingsize.是用于培训分类模型的图像尺寸。

搜索窗口遍历图像的每个缩放增量。

MinSize、MaxSize和ScaleFactor之间的关系

了解要检测到对象大小之间的关系，并且比例因子将有助于您相应地设置属性。的MinSize和最大限度属性限制了要检测的对象的大小范围。理想情况下，当您在处理图像之前知道近似的对象大小时，可以修改这些属性以减少计算时间。它们不是设计来基于对象大小提供结果的精确过滤的。这些属性的行为受ScaleFactor的影响。比例因子决定了搜索窗口大小的量化。

搜索区域＝轮（(培训规模）*（ScaleFactor^N）)

返回的对象大小的实际范围可能与您为MinSize和最大限度属性。例如,

为一个ScaleFactor的价值1．1使用24x24训练尺寸，用于5增量时，搜索区域计算为:

>>搜索区域=圆形（24 * 1.1。^（1：5））

>>26 29 32 35 39

如果你要最大限度到34.，由于搜索区域量化，算法使用的实际最大对象大小将是32.．

合并检测阈值

对于尺度上的每一个增量，搜索窗口遍历图像，在目标对象周围产生多个检测。多个检测被合并到每个目标对象的一个边界框中。你可以使用mergethreshold.属性来控制在合并或拒绝检测之前所需的检测次数。最终边界框的大小是每个检测的边界框的大小的平均值MinSize和最大限度．

参考文献

[1] Lienhart R.，Kuranov A.和V.Pisarevsky“对快速物体检测的升压分类器检测级联的实证分析。”第25届DAGM模式识别学术研讨会论文集。德国马格德堡,2003年。

[2] Ojala Timo, Pietikäinen Matti, Mäenpää Topi，“基于局部二值模式的多分辨率灰度和旋转不变纹理分类”。在机械工程学报，2002．第24卷第7期971-987页。

[3] Kruppa H.，Castrillon-Santana M.和B. Schiele。“通过本地上下文快速且强大的脸部发现”。视觉监视与跟踪与监视性能评估联合IEEE国际研讨会论文集，2003，pp。157-164。

[4] Castrillón Marco, Déniz Oscar, Guerra Cayetano, Hernández Mario，“ENCARA2:视频流中不同分辨率的多个面孔实时检测”。金宝搏官方网站在中国可视通信与图像表示， 2007(18) 2: 130-140页。

[5]余士奇“眼睛检测。”石漆的主页。http://yushiqi.cn/research/eyedetection。

Viola, Paul和Michael J. Jones，“使用简单特征的增强级联快速目标检测”，2001 IEEE计算机学会计算机视觉与模式识别会议论文集，2001年。体积：1，pp.511-518。

[7] Dalal, N.，和B. Triggs，“面向人类检测的梯度直方图”。计算机视觉与模式识别学术会议．第1卷，（2005），PP。886-893。

[8] Ojala，T.，M. Pietikainen和T. Maenpaa，“带有当地二进制模式的多分辨率灰度和旋转不变纹理分类”。模式分析与机器智能学报．第24卷，第7期，2002年7月，971-987页。

扩展能力

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。

使用注意事项及限制:

使用链接到OpenCV（3.4.0版）库的C ++编译器生成便携式C代码。看到使用OpenCV库的函数的可移植C代码生成．
看到系统对象在MATLAB代码生成(MATLAB编码器)．
XMLFILE必须是编译时常量。

另请参阅

图片标志|trainCascadeObjectDetector|insertShape|Vision.Peopledetector|integralImage

主题

外部网站

检测和跟踪实时视频流中的多个面

介绍了R2012a

愿景。CascadeObjectDetector

描述

创建

语法

描述

特性

ClassificationModel- - - - - -训练级联分类模型“FrontalFaceCART”（默认）|字符串

MinSize- - - - - -最小可探测物体的尺寸［］（默认）|双元素矢量

最大限度- - - - - -最大可探测物体的大小［］（默认）|双元素矢量

ScaleFactor- - - - - -用于多尺度目标检测的缩放1．1（默认）|标量

mergethreshold.- - - - - -检测阈值4（默认）|整数

UseROI- - - - - -利用兴趣区域假（默认）|真正的

使用

语法

描述

输入参数

我- - - - - -输入图像灰度|真彩(RGB)

模型- - - - - -分类模型“FrontalFaceCART”（默认）|字符串

XMLFILE- - - - - -自定义分类模型XML文件

roi- - - - - -矩形的兴趣区域研制出向量（默认）

输出参数

bbox.——检测米-By-4矩阵（默认）

对象的功能

所有系统对象都是通用的

例子

使用正面人脸分类模型检测图像中的人脸

利用上体分类模型检测图像中的上体

算法

分类模型的训练

级联分类器

多尺度对象检测

MinSize、MaxSize和ScaleFactor之间的关系

合并检测阈值

参考文献

扩展能力

C / c++代码生成使用MATLAB®Coder™生成C和c++代码。

另请参阅

主题

外部网站

计算机视觉工具箱文档

金宝app

介绍基于MATLAB的深度学习

`ClassificationModel`- - - - - -训练级联分类模型
`“FrontalFaceCART”`（默认）|`字符串`

`MinSize`- - - - - -最小可探测物体的尺寸
`［］`（默认）|双元素矢量

`最大限度`- - - - - -最大可探测物体的大小
`［］`（默认）|双元素矢量

`ScaleFactor`- - - - - -用于多尺度目标检测的缩放
`1．1`（默认）|标量

`mergethreshold.`- - - - - -检测阈值
`4`（默认）|整数

`UseROI`- - - - - -利用兴趣区域
`假`（默认）|`真正的`

`我`- - - - - -输入图像
灰度|真彩(RGB)

`模型`- - - - - -分类模型
`“FrontalFaceCART”`（默认）|`字符串`

`XMLFILE`- - - - - -自定义分类模型
XML文件

`roi`- - - - - -矩形的兴趣区域
研制出向量（默认）

`bbox.`——检测
米-By-4矩阵（默认）

C / c++代码生成
使用MATLAB®Coder™生成C和c++代码。