对象识别

你需要知道的三件事

什么是物体识别?

物体识别是一种计算机视觉技术,用于识别图像或视频中的物体。对象识别是深度学习和机器学习算法的关键输出。当人们看照片或视频时,我们可以很容易地发现人、物体、场景和视觉细节。其目标是教会计算机做人类天生就会做的事情:对图像所包含的内容有一定程度的理解。

图1所示。使用对象识别来识别不同类别的对象。

物体识别是无人驾驶汽车背后的一项关键技术,它能让无人驾驶汽车识别停车标志,或区分行人和路灯柱。它在生物成像、工业检查和机器人视觉等多种应用中也很有用。

对象识别与对象检测

对象检测和对象识别是识别对象的类似技术,但是它们的执行方式不同。对象检测是在映像中查找对象实例的过程。在深度学习的情况下,对象检测是对象识别的一个子集,其中对象不仅被识别,而且还位于图像中。这允许在同一个映像中标识和定位多个对象。

图2。对象识别(左)和对象检测(右)。

物体识别是如何工作的

可以使用各种方法进行对象识别。最近,技术机器学习深度学习已经成为物体识别问题的流行方法。这两种技术都学习识别图像中的对象,但它们的执行方式不同。

图3:物体识别的机器学习和深度学习技术。

下一节将解释机器学习和对象识别的深度学习之间的区别,并说明如何实现这两种技术。

目标识别技术

使用深度学习的对象识别

深度学习技术已经成为一种流行的对象识别方法。深度学习模型比如卷积神经网络,或者美国有线电视新闻网,是用来自动学习一个对象的固有特征,以便识别该对象。例如,CNN可以通过分析成千上万的训练图像,学习使猫和狗不同的特征,从而识别猫和狗之间的差异。

使用深度学习进行物体识别有两种方法:

  • 从零开始训练模型:要从头开始训练一个深度网络,您需要收集一个非常大的标记数据集,并设计一个网络架构来学习特性并构建模型。结果可能令人印象深刻,但是这种方法需要大量的训练数据,您需要在CNN中设置图层和权重。
  • 使用预先训练的深度学习模型:大多数深度学习应用程序使用转移学习方法,包括对预先训练的模型进行微调的过程。从现有的网络(如AlexNet或GoogLeNet)开始,输入包含以前未知类的新数据。这种方法耗时更少,而且可以提供更快的结果,因为该模型已经在数千或数百万张图像上进行了训练。

深度学习提供了高水平的准确性,但需要大量的数据来做出准确的预测。

图4:展示餐厅食品对象识别的深度学习应用。

使用机器学习的物体识别

机器学习技术在物体识别中也很受欢迎,它提供了不同于深度学习的方法。机器学习技术的常见例子有:

机器学习工作流程

要使用标准的机器学习方法进行对象识别,首先要收集一组图像(或视频),然后在每个图像中选择相关的特征。例如,特征提取算法可能会提取边缘或角点特征,这些特征可用于区分数据中的类。

这些特性被添加到机器学习模型中,机器学习模型将把这些特性分成不同的类别,然后在分析和分类新对象时使用这些信息。

您可以使用各种机器学习算法和特征提取方法,它们提供许多组合来创建精确的对象识别模型。

图5:对象识别的机器学习工作流。

使用机器学习进行对象识别提供了选择学习的特征和分类器的最佳组合的灵活性。它可以用最少的数据获得精确的结果。

机器学习和物体识别的深度学习

确定最佳的对象识别方法取决于您的应用程序和要解决的问题。在许多情况下,机器学习可能是一种有效的技术,特别是如果您知道图像的哪些特征或特征是区分对象类的最佳方法。

在选择机器学习还是深度学习时,要考虑的主要问题是你是否有一个强大的GPU和大量标记的训练图像。如果这两个问题的答案都是否定的,那么机器学习方法可能是最好的选择。深度学习技术往往能更好地处理更多的图像,GPU有助于减少训练模型所需的时间。

图6:在深度学习和机器学习之间进行选择的关键因素。

了解更多

其他物体识别方法

根据应用程序的不同,其他更基本的对象识别方法可能就足够了。

  • 模板匹配-它使用一个小图像,或模板,以寻找匹配的区域在一个较大的图像
  • 图像分割和斑点分析-使用简单的对象属性,如大小、颜色或形状

通常情况下,如果可以使用图像分割这样的简单方法来识别对象,那么最好从使用更简单的方法开始。这可以提供一个健壮的解决方案,不需要数百或数千个训练图像或过于复杂的解决方案。

用MATLAB进行目标识别

深度学习和机器学习

只有几行MATLAB®代码,您可以构建机器学习和对象识别的深度学习模型,而不必成为专家。

使用MATLAB进行物体识别可以让你在更短的时间内成功,因为它让你:

  1. 利用你的专业知识和MATLAB学习数据科学:

    您可以使用MATLAB学习并获得机器学习和深度学习领域的专业知识。MATLAB使学习这些领域变得实用和容易。此外,MATLAB使领域专家能够创建对象识别模型——而不是将任务交给不了解您的行业或应用程序的数据科学家。

  2. 使用应用程序来标记数据和建立模型:

    MATLAB允许您用最少的代码构建机器学习和深度学习模型。

    分类学习者应用,您可以快速构建机器学习模型,并比较不同的机器学习算法,而不需要编写代码。

    使用图片标志应用程序,您可以交互式地在图像中标记对象,并在视频中自动地标记ground truth,以培训和测试深度学习模型。这种交互式和自动化的方法可以在更短的时间内获得更好的结果。

  3. 在一个单一的工作流程中集成对象识别:

    MATLAB可以将多个域统一到一个工作流中。使用MATLAB,您可以在一个环境中进行思考和编程。它提供了用于深度学习和机器学习的工具和功能,还提供了一系列用于这些算法的领域,例如机器人计算机视觉和数据分析。

MATLAB自动将您的模型部署到企业系统、集群、云和嵌入式设备上。

获得免费试用

30天的探索在你的指尖。