主要内容

使用深度学习的计算机视觉

利用计算机视觉应用扩展深度学习工作流

通过使用deep learning Toolbox™和computer vision Toolbox™,将深度学习应用于计算机视觉应用。

应用程序

图片标志 为计算机视觉应用程序标记图像
贴标签机视频 用于计算机视觉应用程序的标签视频

功能

boxLabelDatastore 包围框标签数据的数据存储
pixelLabelDatastore 像素标签数据的数据存储
pixelLabelImageDatastore 语义分割网络的数据存储

主题

对象检测

开始使用深度学习的对象检测(计算机视觉工具箱)

基于深度学习神经网络的目标检测。

增加对象检测的包围盒

这个例子展示了如何在对象检测工作流程中执行常见的图像和边界框扩展。

使用R-CNN深度学习训练目标检测器

这个例子展示了如何使用深度学习和R-CNN(卷积神经网络区域)训练一个目标检测器。

导入经过训练的ONNX YOLO v2对象检测器

这个例子展示了如何导入一个预先训练的ONNX™(Open Neural Network Exchange)你只看一次(YOLO) v2[1]对象检测网络,并使用它来检测对象。

导出YOLO v2对象检测器到ONNX

这个例子展示了如何将YOLO v2对象检测网络导出到ONNX™(Open Neural network Exchange)模型格式。

语义分割

使用深度学习开始语义分割(计算机视觉工具箱)

使用深度学习按类分割对象。

在深度网络设计中训练简单的语义分割网络

这个例子展示了如何使用Deep network Designer创建和训练一个简单的语义分割网络。

为语义分割增加像素标签

这个例子展示了如何作为语义分割工作流程的一部分来执行常见的图像和像素标签增强。

使用扩展卷积进行语义分割

使用扩展卷积训练语义分割网络。

基于深度学习的多光谱图像语义分割

这个例子展示了如何使用U-Net对7个频道的多光谱图像进行语义分割。

基于深度学习的三维脑肿瘤分割

这个例子展示了如何训练一个3-D U-Net神经网络,并从3-D医学图像执行脑肿瘤的语义分割。

用Tversky Loss定义自定义像素分类层

这个例子展示了如何定义和创建一个使用Tversky loss的自定义像素分类层。

利用Grad-CAM研究语义分词网络

这个例子展示了如何使用Grad-CAM来探索语义分割网络的预测。

视频分类

利用深度学习从视频和光流数据中识别活动

这个例子首先展示了如何使用预训练的基于膨胀3-D (I3D)双流卷积神经网络的视频分类器执行活动识别,然后展示了如何使用传输学习来训练这样的视频分类器,使用RGB和来自视频[1]的光流数据。

使用视频和深度学习的手势识别

使用预先训练的SlowFast视频分类器进行手势识别。

特色的例子