使用深度学习的计算机视觉

利用计算机视觉应用扩展深度学习工作流

通过使用deep learning Toolbox™和computer vision Toolbox™，将深度学习应用于计算机视觉应用。

应用程序

图片标志	为计算机视觉应用程序标记图像
贴标签机视频	用于计算机视觉应用程序的标签视频

功能

`boxLabelDatastore`	包围框标签数据的数据存储
`pixelLabelDatastore`	像素标签数据的数据存储
`pixelLabelImageDatastore`	语义分割网络的数据存储

主题

对象检测

开始使用深度学习的对象检测(计算机视觉工具箱)

基于深度学习神经网络的目标检测。

增加对象检测的包围盒

这个例子展示了如何在对象检测工作流程中执行常见的图像和边界框扩展。

使用R-CNN深度学习训练目标检测器

这个例子展示了如何使用深度学习和R-CNN(卷积神经网络区域)训练一个目标检测器。

导入经过训练的ONNX YOLO v2对象检测器

这个例子展示了如何导入一个预先训练的ONNX™(Open Neural Network Exchange)你只看一次(YOLO) v2[1]对象检测网络，并使用它来检测对象。

导出YOLO v2对象检测器到ONNX

这个例子展示了如何将YOLO v2对象检测网络导出到ONNX™(Open Neural network Exchange)模型格式。

语义分割

使用深度学习开始语义分割(计算机视觉工具箱)

使用深度学习按类分割对象。

在深度网络设计中训练简单的语义分割网络

这个例子展示了如何使用Deep network Designer创建和训练一个简单的语义分割网络。

为语义分割增加像素标签

这个例子展示了如何作为语义分割工作流程的一部分来执行常见的图像和像素标签增强。

使用扩展卷积进行语义分割

使用扩展卷积训练语义分割网络。

基于深度学习的多光谱图像语义分割

这个例子展示了如何使用U-Net对7个频道的多光谱图像进行语义分割。

基于深度学习的三维脑肿瘤分割

这个例子展示了如何训练一个3-D U-Net神经网络，并从3-D医学图像执行脑肿瘤的语义分割。

用Tversky Loss定义自定义像素分类层

这个例子展示了如何定义和创建一个使用Tversky loss的自定义像素分类层。

利用Grad-CAM研究语义分词网络

这个例子展示了如何使用Grad-CAM来探索语义分割网络的预测。

视频分类

利用深度学习从视频和光流数据中识别活动

这个例子首先展示了如何使用预训练的基于膨胀3-D (I3D)双流卷积神经网络的视频分类器执行活动识别，然后展示了如何使用传输学习来训练这样的视频分类器，使用RGB和来自视频[1]的光流数据。

使用视频和深度学习的手势识别

使用预先训练的SlowFast视频分类器进行手势识别。

特色的例子

使用Faster R-CNN深度学习进行目标检测

训练一个更快的R-CNN(区域与卷积神经网络)目标检测器。

打开生活的脚本

基于YOLO v2深度学习的目标检测

训练一个你只看一次(YOLO) v2对象检测器。

打开生活的脚本

基于点网深度学习的点云分类

训练一个点云分类的点网络。

打开生活的脚本

基于SSD深度学习的目标检测

训练单一射击探测器(SSD)。

打开生活的脚本

基于YOLO v3深度学习的目标检测

训练YOLO v3对象检测器。

打开生活的脚本

使用Mask R-CNN执行实例分割

使用基于多类掩码区域的卷积神经网络(R-CNN)分割人和汽车的单个实例。

打开生活的脚本

基于深度学习的语义分割

使用深度学习训练一个语义分割网络。

打开生活的脚本

使用深度学习从分割地图生成图像

从语义分割地图生成一个场景的合成图像。

打开生活的脚本

使用深度学习估计身体姿势

使用OpenPose算法估计一个或多个人的身体姿势。

打开生活的脚本

使用视频和深度学习的手势识别

使用预先训练的SlowFast视频分类器进行手势识别。

打开生活的脚本

深度学习工具箱文档

金宝app

用MATLAB介绍深度学习

下载电子书