来自系列:基于MATLAB的计算机视觉
Sandeep Hiremath, MathWorks
学习MATLAB如何使计算机视觉很容易开始。
计算机视觉使用图像和视频来检测、分类和跟踪对象或事件,以便了解真实世界的场景。在本介绍性网络研讨会中,您将学习如何使用MATLAB开发计算机视觉算法,以解决现实世界中的成像问题。
我们将通过现实世界示例展示MATLAB如何易于:
这个网络研讨会假设有一些MATLAB的经验,而没有计算机视觉的经验。我们将重点介绍计算机视觉工具箱。
有关使用MATLAB的计算机愿景的更多详细信息,请参阅以下链接:
记录:11月18日2020年
欢迎来到电脑愿景,使网络磁盘轻松。我的名字是SANDEEP,我在MathWorks的产品营销团队中。计算机愿景广泛用于我们的客户解决不同应用领域的各种视觉问题。例如,在自动化驾驶到设计车道出发警告系统。在机器人中,帮助计划火星流动站。
这里是一个基于计算机视觉的交通监控系统的简单示例,就像您在驶过红绿灯时可能注意到的那样。在这里,一个基于摄像头的监控系统跟踪任何给定时间点现场的汽车数量。在这个系统中,计算机视觉主要用于检测和统计摄像机发出的光视频的每一帧中的车辆。在视频中检测像汽车这样的物体是一项常见的计算机视觉任务,但还有更多类似的任务。
那么,这些常见的任务或问题是什么呢?嗯,如果你是计算机视觉新手,你可能有兴趣知道如何在场景中检测对象。或者如何测量图像中的对象或区域。或者如何使用深度学习检测对象或对事件进行分类。因此,在本视频中,我们的目标是帮助您开始解决常见的计算机视觉任务或问题。您将通过使用MATLAB的一些实际示例来实现这一点。
所以这里是我们将在接下来的30分钟左右覆盖的例子。所以让我们开始我们的第一个例子。在此示例中,我在左侧有一个杂乱的扑克牌的图像。和右侧特定扑克牌的图像。我的目标是检测,或在一堆卡片的图像中定位特定的扑克牌。现在这似乎是一件简单的任务。但是,解决这个问题存在许多挑战。感兴趣的对象看起来较小,或大于模板图像。可以旋转,或歪斜。或者它们可能是一个部分隐藏在其他物体后面。 These are some common challenges that you will notice in most object detection problems.
在这里,您不能使用标准图像处理算法,如模板匹配以查找此对象。您需要更复杂和强大的方法。为了解决这个问题,我选择了一个称为特征检测提取的非常基本的计算机视觉工作流程和匹配。因此,在我们理解这个工作流程之前,让我们先了解什么是功能。简单来说,特征是图像中的不同区域,其导致另一个图像中的唯一匹配。以及在许多图像中可重复的东西。图像中的特征的一些很好的示例是角落,边缘,斑点或者对象的模板,或场景本身中的区域。
那么这个工作流程是什么样的?基于功能的对象检测工作流程涉及三个主要步骤。首先,检测对象的模板图像中的有趣功能。这是由绿色标记显示的。你也对其他形象做了相同的事情。其次,拍摄检测到的功能围绕的区域,并将一些关于该区域的一些信息进行编码到所谓的特征描述符中。这称为特征提取,并且由标记周围的绿色圆圈表示。您对两个图像执行此操作。
第三,在提取的两幅图像特征之间寻找对应的匹配。然后去掉任何异常值。一旦你有了一组匹配特征,你就可以估计物体在场景中的位置。现在,让我们进入MATLAB,看看如何解决这个问题。
这是我的MATLAB环境。现在,我要做的第一件事是阅读我们正在处理的两个图像。一是我们要找的红桃王的参考图像。第二,是包含这张卡的杂乱图像。我将使用I am read from image pricing toolbox来读取这两张图片。然后用I am sure配对把它们放在一起展示。
这是我的照片。正如您所看到的,红心之王卡和图像卡的方向和比例与参考图像不完全相同。也可能不在同一个参考平面上。因此,像模板匹配这样的简单图像定价技术在这种情况下不起作用。我们需要一种更稳健的方法,即在这些图像中查找特征,并进行比较以找到匹配。所以在下一节中,我将使用一种称为surf的算法来检测这些图像中的特征。
现在,冲浪专门用于2D灰度图像。所以我必须使用RGB创建最初,将彩色图像转换为灰度。然后,我使用了从计算机视觉工具箱和参考图像中检测到冲浪功能。这应该输出图像的检测特征点。接下来,我想可视化此图像的检测到的特征点。所以在这里,我选择绘制最强的50分。
这里是参考图像,以及整个图像中50个最强的特征点,其位置由十字表示。这些位置点周围的圆圈代表特征的大小,这两者都是特征描述符的重要部分。这些特征描述符表示描述图像中其他特征的独特且有趣的信息,并将其与图像中的其他特征区分开来。
现在,SURF算法通过检测此图像中的BLOB来定义这些功能。Blobs只不过是具有高对比度像素的图像中的连接区域。在我们的案例中,一块Blob是卡中的心脏套装。或者国王的眼睛是角色K区域的较小的眼睛。现在,像冲浪一样有许多通过电脑视觉工具箱可用的其他检测算法。例如,我们有快速在检测图像中的角落时真正擅长。因此,请参阅帮助文档以了解有关所有这些不同特征检测算法的更多信息。
现在,让我们回到我们的剧本,看看下一个内容。所以接下来,我也将检测卡图像上的冲浪功能。确保在两个图像上使用相同的检测算法,以便我们可以将苹果制作到苹果比较,并匹配这些功能。所以让我们运行这个部分。并看看这个时间,图像上的300个最强点。所以在这里,您可以看到我们在Hearts Card Region之王中有功能点,也可以在图像中的其他卡片上。
现在,一旦我们检测到此图像的特征点,接下来,我们将要提取该特征描述符,这些功能描述符是这些点周围的区域映射。为此,我正在使用计算机视觉工具箱中的提取功能功能。我以前通过灰度图像和检测到的点。这将为我们提供特征向量,以及每个图像的相应位置。现在,这里使用的提取方法取决于所用的检测算法,它在我们的情况下冲浪。我现在拥有两个图像的特征描述符。
接下来,我需要将它们进行比较以查找匹配项。因此,要执行此操作,我将在计算机视觉工具箱上使用匹配功能,返回两个输入功能集中的匹配功能的索引。然后,我可以获得两个图像的相应匹配特征点,并使用显示匹配功能以查看匹配点。让我们运行此部分,并在两个图像上看到匹配点。
正如您在这里看到的,match features在这两幅图像中找到了大量匹配项。除了黑桃杰克牌上的这两点之外,这些比赛都在红桃之王区域。现在,请注意一些特性是如何匹配的,比如在卡片字符区域键中,与卡片图像中的字符匹配。但这里的K也是相反的。原因是surf算法是旋转不变的,这意味着它将检测匹配和特征,而不管它们的方向如何。而且,无论规模大小。这就是为什么基于特征的检测器比简单的模板匹配技术更健壮。
现在我们已经找到了两张卡片之间的匹配,我们还没有完成检测问题。我需要通过去除异常值来改进匹配,包括重复的匹配,比如反向匹配字符K,这样我就可以在纸牌图像中找到红桃王所在的确切区域。为此,我将使用计算机视觉的估计几何变换函数工具箱来计算确定参考图像的变换矩阵几何,和空间的转换,这样它的边界地区内最适合红心国王卡在卡的形象。
该函数还返回通过消除在黑桃卡的插孔中看到的所有异常值来获得的两个图像的Inlier点,使用称为Ransac的算法。Ransac或随机样本共识是一种数学模型,它使用迭代方法来估算入器来估算入物,观察点以找到最佳拟合结果。在我们的情况下,这是一个几何变换,有助于将参考卡片图像拟合到杂乱的卡的图像。您可以通过参考估计几何变换功能的帮助信息来了解更多有关此算法的信息。
现在,让我们继续,运行该部分以再次查看匹配的功能。但这一次,与离群值的遥远。好了。这些异常值和黑桃杰克牌已经被移除。另外,请注意我们之前看到的一些模棱两可的匹配也被消除了。最后,使用我们之前得到的变换矩阵,我们可以继续,变换参考卡图像尺寸的矩形,并称之为新的长方体多边形。
然后,使用它输入卡的图像,以指示在杂乱的卡图像中检测到的卡的确切位置。这是最后的结果。到目前为止,我们看到的是如何使用参考图像检测图像中的卡。现在,如果我们想检测类型或识别这张卡呢?也就是说,这是一张红桃王牌。现在,我们可以再次使用特征匹配方法来实现这一点。但让我们看看更复杂的方法,我们将使用经过训练的检测算法来执行检测。
使用经过训练的检测器,而不是使用模板来查找和匹配特征,我们将使用类似surf的技术从大量图像(例如,角色K)中收集特征集。然后,使用机器学习模型,如支持向量机,我们将设计一个检测器,可以检测到其他图像中的字符。由于经过训练的检测器已使用数百到数千个模板图像的特征进行训练,因此它是一种更为稳健的方法,就像在不同照明条件下检测对象,或尝试按其类别查找对象一样。也就是说,就像在图像中检测一辆汽车,而不考虑其型号或品牌。
因此,在我们的情况下,让我们继续使用火车检测器来通过检测卡内的字体检测卡字符。这是,这是心脏卡之王的字母k。只要你知道,我将使用光学字符识别或OCR算法来完成此操作。所以让我们继续前进,看看如何在Matlab中使用此算法。首先,我们将使用FitGeoTrans转换卡的图像以匹配参考图像。我们这样做,以便可以在空间上调整图像以匹配参考图像的尺寸。通过这样做,我们可以轻松提取卡片中的字符,并在卡中的套件信息,因为我们知道这始终可用在任何卡的左上角。
所以让我们继续前进,并使用IMWARP函数拆除卡片图像,并查看输出。所以这是心卡地区的国王,并被转变的卡片的形象。接下来,我需要在包含字符和适合的卡中提取该区域,并使用提取的区域单独检测它们中的每个区域。要提取这些区域,我有一个辅助函数,Getcardrois对我来说执行了这个提取,并返回包含字符的区域和适合的区域。我正在使用montage命令来显示提取的区域。所以让我们运行此部分,并查看输出。
以下是作为两个单独的子图像提取的区域。接下来,我需要识别第一子图像中的字符。为此,我可以使用光学字符识别或OCR算法。OCR是一种正确使用的技术来检测,并识别图像中的文本。这可以是打印的,或手写的文本。在MATLAB中,我们有一个预先训练的OCR函数,可在计算机视觉工具箱中使用。默认情况下有多个字体可以检测到,但也可以训练以检测自定义字体。所以在我的脚本中,我正在使用OCR函数来检测子图像中的字符。
这里,是OCR返回的输出。如你所见,它已经成功检测到k这个card character。接下来,我需要在第二个sub image中找到suit的类型。为此,我采用了一种使用模板匹配的更简单的方法。我只是将这个子图像与四种不同套装中的一组模板图像进行比较。我在用幻象。TemplateMatcher系统对象从计算机视觉工具箱执行模板匹配。如果你想了解更多关于系统对象的信息,请去找vision。帮助文档中的TemplateMatcher。
我在for循环中的所有模板图像上运行匹配。这里,在for循环中,我一次读取一个模板映像,调整子图像的大小以匹配模板图像,然后执行模板匹配。在这种情况下,系统对象,返回最大度量值对应于最佳匹配的匹配度量。所以让我们运行该部分,并看看我们的子图像的结果看起来像什么。正如您所看到的,我们已成功检测到与这些心灵匹配的模板的输出。
这里要注意的一件事是,模板匹配是一个非常基本的检测技术,在这种特定情况下工作得很好。但如果西装未对齐,同样缩放或相比变化,这将失败。因此,对于更复杂的检测问题,考虑使用更强大的方法,如我们之前看到的特征检测。最后,我们可以用检测到的卡片字符向卡片映像注释,并根据心之王的名称。
像OCR一样,通过计算机视觉工具箱,MATLAB中还有很多其他的物体检测器,可以用来检测一些常见的物体,如条形码、人、脸、视频中的前景物体和博客。其中一些检测器还可以使用您自己的数据进行训练,以检测其他感兴趣的对象。例如,在道路场景中检测行人。
通过计算机视觉工具箱,MATLAB还为您提供了一套基于几个流行的深度学习网络的现成的对象检测器。在MATLAB中,您还可以输入并使用预先训练好的深度学习网络来解决对象检测问题。例如,在这段视频中,我们展示的是一个名为AlexNet的预先训练网络,它经过训练可以检测大约1000个不同的对象类。MATLAB允许您用一行代码导入这个常用的网络,并在计算机视觉应用程序中使用它。
有许多像AlexNet这样的深度学习模型在研究和商业领域中被广泛使用,您可以快速导入MATLAB,并开始在您的解决方案中使用它们。金宝搏官方网站现在,请注意,您可以在MATLAB中用新的数据重新训练这些网络,以检测其他感兴趣的对象。下面是一些常用的深度学习检测器的列表。同时,请注意,这些在MATLAB中是可用的现成函数。我想强调的另一件事是,MATLAB,除了可以很容易地将深度学习应用于计算机视觉问题,使用预先训练好的网络,它还提供交互式应用程序,比如标签应用程序,和深度网络设计师应用程序,使整个工作流的免费培训这些网络是设计新的网络从无到有非常方便,剥削的过程。
现在,让我们移动到第二个例子,这是测量图像中对象的大小。在该示例中,我拥有的是一种图像,它是不同种类的混合,以及少数其他对象。我想做的就是分开图像中的种类,然后确定所有种类的总价值。例如,如果我有两个季度和一个镍,总价值为0.55美元。现在,这样做的一种方法是基于它们的大小来确定图像中的不同类型的种类。然后,如果我知道每个硬币类型的真正直径,例如,一季度是24.26毫米,我可以使用这两条信息,并找出图像中的每种类型有多少种。
之后,它是计算图像中硬币的总值的简单数学。现在,要比较图像中的基于像素的维度,以及对象的实际大小或维度,我们需要计算现实世界单位中的像素的大小。此因素将帮助我们找到任何对象的真实大小,或图像内的区域。现在,在真实世界单位中准确测量像素大小存在一些挑战。一个主要挑战是由于相机性质引起的扭曲可能会有效地影响此类测量。
为了解决这种失真相关的挑战,我将使用摄像机校准工作流。校准使我们能够估计镜头和相机的属性参数。那么这些相机属性是什么呢?有一些固有的特性,比如焦距,光学中心,透镜畸变,系数。还有一些外部参数,比如位置,相机相对于物体的方向。使用估计的参数,我们就可以校正从镜头中拍摄的图像,以应对可能存在的畸变。
摄像机标定是一种非常常用的技术,在计算机视觉中有许多应用。例如,作为校正图像以消除镜头失真问题的预处理步骤,或试图通过将同一镜头拍摄的多个图像拼接在一起来构建全景视图。或者,当从镜头估计深度或物体的接近程度时,特别是当使用工作室基于视觉的相机时。在我们的例子中,我们将主要专注于使用校准来消除图像中的畸变,以帮助精确测量像素大小和真实世界的单位。
现在,让我们转到MATLAB,看看如何解决这个问题。这是我们将要处理的图像。如您所见,此图像实际上有一些类型,并且在图像的底部有一些其他对象。在图像的顶部,我们有一个棋盘格图案。因此,棋盘格模式对于两件事来说非常重要。一是能够进行摄像机标定。第二,是变换图像的方向,以及图像中可能存在的任何其他扭曲和扭曲。
所以让我们前进第一步,这是相机校准。因此,要执行相机校准,我将使用计算机视觉工具箱可用的相机校准器应用程序。要得到它,我要去apps选项卡。在图像处理和计算机视觉部分内,我可以访问相机校准器应用程序。让我们带上那个。
相机校准器应用程序的第一步,是带来我们将用于校准步骤本身的图像。为了做到这一点,我点击Add images。在这里,我可以选择图像,我要用它来进行校准。在这个例子中,我使用了7张图片。但通常情况下,在钻井情况下推荐使用10至20张图像。同样在这里,它会问你棋盘格的大小它将用于校准过程。我知道棋盘图案中的每一个正方形大约是20毫米。
提供,然后应用程序前进,然后开始查看图像,然后开始检测支票簿。然后,它提供了检测结果。所以在这里,您可以看到它在所有六个和七个图像中检测到棋盘。它说它会拒绝其中一个图像。所以我们会说好的。然后,它已经向我展示了它用于校准过程的六个图像。
所以这是结果。您可以看到它已检测到每个图像中的每个图像中的棋盘模式中的点。现在,我要做的下一件事就是能够查看相机校准器应用程序中提供的一些选项。这里的第一件事是相机模型。我可以选择标准镜头或鱼眼或广角镜头。在我的情况下,它是标准镜头。所以我只是把它保持为我的默认选择。
此外,我有选择帮助我提高我的参数估计。为此,我具有我实际选择的径向失真系数。径向失真通常是沿着镜头的边缘所看到的,沿着光学中心。您希望纠正这些扭曲专门针对广角镜头。如果您选择,您也可以计算,偏斜和切向扭曲。目前,我将默认保留这些选项。然后,我要去校准按钮。这现在应该前进,开始校准过程,并给我一些结果。
我想在这里向您展示的第一件事是投影错误。如您所见,再现错误通常是校准错误。我们希望确保我们将错误值保持低。所以要做的方式是删除任何异常值。在这种情况下,棋盘的第二个图像肯定会略高于整体均值误差。我将选择删除此功能,然后用剩下的五个图像重新校准。所以现在,你可以看到我已经删除了该图像,并且我的总体平均误差是一个大约0.57像素。之前,它是约0.63像素。这不是很差,但这是试图改善校准结果的过程。
在此之后,我可以继续,并导出摄像机校准参数到MATLAB工作区。我要保存这个的变量叫做摄像机参数。现在,你知道,如果你手动做这个相机校准过程,它可能会非常复杂,而且很难看。相机校准程序真的有助于使整个工作流程非常方便,容易,而不是校准过程中的专家。它可以让你自动检测棋盘点,它可以让你使用不同的相机型号,标准镜头,或直角镜头。它还会自动为你校准图像,然后让这些结果在MATLAB环境中可用,并使用它进行进一步的分析。
好的。所以现在我们已经完成了相机校准过程,我让我的相机参数保存为垫文件,我们可以继续,并了解如何使用相机参数来贴变硬币的图像。然后,使用此未变量的图像,以进行硬币尺寸的真实测量。我的最终目标是根据其尺寸来识别硬币,并找到图像中所有硬币的总价值。现在,让我们来看看这个图像。
所以这是图像。如您所见,它包含硬币,以及图像的下半部分的其他对象。和棋盘图案上半部分。现在,棋盘模式在解决这个问题方面非常显着。我们稍后会详细介绍这一点。使用从摄像机校准过程中获得的相机参数,需要纠正此图像或未置换。这样,在进行进一步之前,图像在进一步之前没有任何扭曲。为此,我将首先加载相机对图像,然后使用从计算机视觉工具箱中的未破坏图像功能来纠正图像。因此,让我们运行该部分,并查看输出。
在我们的例子中,未失真的图像看起来没什么不同。但如果我们有一张用广角镜头拍摄的图像,那么你会注意到在不失真后的显著差异。接下来,在我开始检测和测量硬币之前,我必须确保图像中的所有像素都具有相同的像素到真实世界的单位因子,这是在整个图像中进行精确测量的一个非常重要的步骤。为此,我们必须使用参考棋盘模式变换原始图像,因为我们知道它是真实世界的维度。此转换将确保像素到真实世界的测量值在整个图像上是一致的。
现在,让我们看看这个转变是如何工作的。我将使用计算机视觉工具箱中提供的检测棋盘点函数首先确定棋盘图案点。让我们在图像中显示这些点。接下来,使用我了解的信息关于棋盘图案,例如沿行的正方形,以及沿着列,我可以确定侦探棋盘区域的角点。然后,我们将找到一个新的平面中角落的近似位置,这些平面将消除由于摄像机的角度而可能存在的任何透视突起,该突起可能存在于包含棋盘模式的平面和硬币。
在一个名为浅洞的变量中,我们可以使用这些新的积分。所以让我们运行该部分,并在角分点看到基点。现在,使用基点作为引用,我们将找到所需的转换矩阵,我们需要在基点表示的平面上投影图像。我们使用FitGeOtrans函数从图像按压工具箱执行此操作。这将返回一个转换矩阵,即我可以使用imwarp函数使用来扭曲种类的图像。让我们运行该部分,并查看输出。
所以这是一个变换的图像。因此,此图像现在已准备好进行准确测量。既然我有一个包含硬币的变换图像,我需要做的下一件事就是检测图像中的硬币,除了圆对象。因此,在本节中,我首先使用Imbinarize函数将变换图像转换为二进制。我这里有一个滑块来调整阈值。这样,我可以从二进制输出获得所需的结果。然后,我正在使用imfindcircles找到来自图像处理工具箱的圆圈,以查找图像中的硬币。
如你所见,我这里有几个参数。我这里还有一个滑块来调整灵敏度参数,这样它只会拾取图像中代表硬币的最强圆。通过参考imfindcircles函数的帮助信息,可以了解有关该函数其他参数的更多信息。一旦我检测到了圆,知道了圆心的像素坐标和半径,我将使用viscircles在硬币图像上显示这些圆形区域。让我们运行这个部分,看看结果。
如你所见,硬币被检测为圆形。它错过了一枚硬币。因此,我可以返回到“我在寻找圆”,并通过调整此处的滑块来增加灵敏度,以确保已检测到所有硬币。所以这里需要注意的一点是,imfindcircles圆对于此类检测问题来说不是一种非常可靠的技术。我们在此假设硬币是图像中唯一的圆形物体。此外,在等待光线条件下,圆的检测可能并不总是很好。在这种情况下,我们将不得不使用一种更稳健的方法,比如使用我们在卡片检测示例中讨论的火车检测器来检测图像中的硬币。
现在我们已经在图像中检测到了硬币区域,并且我知道了硬币的大小和像素值,接下来,我将需要计算出真实世界中硬币的大小。为了做到这一点,我首先需要知道像素与真实世界的单位系数是多少,然后我可以用它来计算真实世界的大小,单位是毫米,硬币的半径。为了做到这一点,我将再次使用,棋盘图案作为我的参考。我将像之前一样检测棋盘点,然后以像素计算模式中的正方形的大小。我知道棋盘图案的正方形尺寸是20毫米。通过这个,我可以计算出这个图像的像素到毫米的系数。因此,让我们运行该部分,并查看输出。
这是使用棋盘的像素到毫米的系数。现在用这个像素来计算硬币的毫米因子,大小和像素,我可以用毫米来计算硬币的大小。就像已知棋盘的正方形大小一样,我们也知道图像中硬币类型的真实半径。在我们的例子中,这些是美分、镍币和25美分。
因此,在此,在此处的下一部分,我发现使用真尺寸值的三个硬币类型的像素大小,以及我们之前计算的毫米因子的像素。随着这作为参考,我可以将它们与我们从图像中提前获得的圆圈的像素值进行比较。然后,我可以将每个圆圈弯曲为一分钱,镍或季度。
在这里,我首先对圆的半径排序。然后利用MATLAB的直方图函数,以硬币像素大小为参考,对圆进行弯曲。让我们运行这部分,看看这些圆圈作为这三种硬币类型的分布。你可以在图表中看到,我们有两个圆圈,分别作为美分,3个镍币和4个25美分硬币。我再次使用这个直方图函数,来获得这次的计数,并显示计数。一旦我有了图像中每种硬币类型的数量,我就可以很容易地计算图像中硬币的总价值。这是1.17美元,也就是图中硬币的实际价值。通过这种方式,我们验证了我们的硬币测量和装箱实际上对这幅图像很有效。
最后,我们可以在硬币的图像上显示我们的最终结果。注意,我在这里再次使用了粘圈,用彩色圆圈表示图像中不同的硬币类型。现在,如果我们必须测量一个物体的大小,比如叶子,它没有一个非常明确的形状,而且没有简单的方法来自动检测图像中的这样一个物体?在这种情况下,一旦我们知道了包含叶子的图像的像素到MM因子,我们就可以使用imdistline,它允许您交互地测量叶子区域中两个像素之间的距离。然后,你可以用它来计算真实世界单位的距离使用像素到MM因子。
所以在这里,我已经用毫米的电脑距离取代了像素额定值。因此,从某种意义上说,我们已经看到,如果我们在任何图像中具有像棋盘模式的参考,我们可以将像素计算到现实世界单位因子,并使用它来测量该图像中的任何对象或区域的真尺寸。因此,我们在Matlab中看到的是支持标准和广角镜头的相机校准器应用程序。金宝app电脑Vision Toolbox提供单独的串行相机校准器应用程序,以帮助校准从Studio相机对拍摄的图像,通常用于深度估计的任务。
这就是最后一张总结幻灯片。我们已经看到,对于计算机视觉新手来说,使用MATLAB可以轻松入门。我们已经看透了一些例子——MATLAB使使用现成的功能和基于深度学习的检测器检测对象变得非常简单,甚至可以使用您自己的数据对其进行自定义,以便使用交互式校准应用程序和对象分析工作流进行真实世界的测量和图像。并借助预先培训的网络和文档中的详细示例,快速提升深度学习。
综上所述,如果你正在考虑下一步该怎么做,下面是一些步骤。请访问计算机视觉工具箱产品页面,了解有关计算机视觉、其应用程序和工具箱附带的其他功能的更多信息。如果你想在学习如何使用计算机视觉工具箱方面获得更深入的经验,请报名参加教练指导的培训课程。这也是一门在线课程。如前所述,还有一个是关于深度学习的。如果您准备探索该产品,并开始解决您的问题,那么今天就获得该产品的试用许可。
正如我们所见,计算机视觉工具箱中有一些基于深入的基于学习的对象探测器。但是还有很多,你可以与深度学习做。转到深入学习工具箱页面以了解有关此产品的更多信息,以及其广泛的功能。其中一些人也可能有兴趣最终在硬件平台上运行计算机视觉算法,如扶手覆盆子PI,或基于GPU的NVIDIA Jetson板。使用Matlab解决方案页面转到嵌入式愿景,以了解有关此问题的更多信息,以及来自MATLAB的其他硬件实现相关功能。非常感谢您的关注。
你也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。