卷积神经网络

你需要知道的三件事

卷积神经网络(CNN或ConvNet),是一种用于深度学习它直接从数据中学习,无需手动提取特征。

CNN对于在图像中查找模式以识别对象、人脸和场景特别有用。它们还可以非常有效地对非图像数据(如音频、时间序列和信号数据)进行分类。

应用程序需要目标识别计算机视觉-比如无人驾驶车辆以及人脸识别应用——很大程度上依赖cnn。

cnn为何如此有用?

由于三个重要因素,使用CNN进行深度学习很受欢迎:

  • CNN消除了人工提取特征的需要——特征直接由CNN学习。
  • CNN产生高度准确的识别结果。
  • CNN可以针对新的识别任务进行重新培训,使您能够在现有网络上进行构建。

cnn为揭示和学习图像和时间序列数据中的关键特征提供了一个优化的体系结构。cnn是一项关键的应用技术,如:

  • 医学成像: cnn可以检查成千上万的病理报告,在图像上直观地检测癌细胞的存在或缺失。
  • 音频处理:关键字检测可用于任何带有麦克风的设备,以检测何时说出某个单词或短语(“嘿,Siri!”)。CNN可以准确地学习和检测关键字,同时忽略所有其他短语,而不管环境如何。
  • 停车标志检测:自动驾驶依靠cnn精确检测标识或其他物体的存在,并根据输出做出决定。
  • 合成数据生成:使用生成对抗网络(GANs),可以生成新图像用于深度学习应用,包括人脸识别和自动驾驶。

了解更多

cnn是如何工作的

卷积神经网络可以有数十或数百层,每层都学习检测图像的不同特征。对每一幅不同分辨率的训练图像进行滤波,每一幅卷积图像的输出作为下一层的输入。金宝搏官方网站过滤器可以从非常简单的特征开始,如亮度和边缘,并增加复杂性,以唯一定义对象的特征。

特征学习、图层和分类

与其他神经网络一样,CNN由输入层、输出层和中间的许多隐藏层组成。

这些层执行更改数据的操作,目的是学习特定于数据的特性。最常见的三个层是:卷积、激活或ReLU和池。

  • 卷积将输入的图像通过一组卷积过滤器,每个过滤器激活图像的某些特征。
  • 整流线性单元(ReLU)通过将负值映射为零并保持正值,可以实现更快、更有效的训练。这有时被称为激活,因为只有激活的特征才会被带入下一层。
  • 通过执行非线性下采样简化输出,减少网络需要学习的参数数量。

这些操作在数十层或数百层上重复,每层学习识别不同的特征。

具有许多卷积层的网络示例。对每一幅不同分辨率的训练图像进行滤波,每一幅卷积图像的输出作为下一层的输入。金宝搏官方网站

共享权重和偏差

像一个传统神经网络在美国,CNN的神经元具有权重和偏差。模型在训练过程中学习这些值,并在每个新的训练示例中不断更新它们。而对于cnn,给定层中所有隐藏神经元的权值和偏差值是相同的。

这意味着所有隐藏的神经元都在图像的不同区域检测相同的特征,如边缘或斑点。这使得网络能够容忍图像中对象的平移。例如,经过培训的识别汽车的网络将能够在图像中的任何位置识别汽车。

分类层

在学习了许多层的特征之后,CNN的体系结构转向了分类。

倒数一层是一个完全连接的层,输出K维向量,其中K是网络能够预测的类的数量。这个向量包含任何图像被分类的每一类的概率。

CNN体系结构的最后一层使用分类层(如softmax)来提供分类输出。

使用MATLAB设计和培训cnn

使用MATLAB®深度学习工具箱™使您能够设计、培训和部署cnn。

MATLAB提供了大量来自深度学习社区的预训练模型,可用于从新数据集学习和识别特征。这种方法被称为迁移学习,是一种不用从零开始就可以应用深度学习的便捷方法。像GoogLeNet、AlexNet和Inception这样的模型提供了一个探索深度学习的起点,利用专家构建的经过验证的架构。

设计和培训网络

使用深度网络设计器,您可以导入预先训练的模型或从头开始构建新的模型。

Deep Network Designer应用程序,用于交互式构建、可视化和编辑深度学习网络。

你也可以在应用程序中直接训练网络,并通过精确、损失和验证指标的图来监控训练。

使用预先训练的模型进行迁移学习

对预先训练好的网络进行微调转移学习通常比从头开始训练要快得多,也容易得多。它需要最少的数据量和计算资源。迁移学习使用一类问题的知识来解决类似的问题。你从一个预先训练好的网络开始,用它来学习一项新任务。迁移学习的一个优点是,经过预训练的网络已经学习到了一组丰富的特征。这些功能可以应用于其他类似的任务。例如,您可以对一个网络进行数百万张图像的训练,然后仅使用数百张图像对其进行重新训练,以进行新的对象分类。

gpu硬件加速

卷积神经网络可以训练成百上千甚至上百万的图像。当处理大量数据和复杂的网络架构时,GPU可以显著加快训练模型的处理时间。

英伟达®GPU,加速深度学习等计算密集型任务。

了解更多


使用CNN的应用程序

目标检测

目标检测是对图像和视频中的目标进行定位和分类的过程。计算机视觉工具箱™提供培训框架,使用YOLO和更快的R-CNN创建基于深度学习的对象检测器。

基于深度学习的目标检测

这个例子展示了如何使用深度学习和R-CNN(卷积神经网络区域)训练目标检测器。

关键字检测

语音到文本的一个示例应用是关键字检测,它可以识别特定的关键字或短语,并将它们用作指令。常见的例子是唤醒设备和开灯。

基于深度学习的关键字检测

本示例演示了如何使用MATLAB来识别和检测音频中语音命令的存在,并可用于语音辅助技术

语义分割

利用cnn进行语义分割,通过分类标签识别图像中的每个像素。语义分割可用于自动驾驶、工业检测、地形分类和医学成像等应用。卷积神经网络是构建语义分割网络的基础。

基于深度学习的语义分割

这个例子展示了如何使用MATLAB构建一个语义分割网络,将图像中的每个像素标识为相应的标签。

MATLAB为所有东西的深度学习提供了一个工具和功能。使用cnn来增强信号处理、计算机视觉或通信和雷达方面的工作流程。


如何更多地了解cnn

下载188bet金宝搏支持使金宝app用CNN进行图像分析的产品包括MATLAB,计算机视觉工具箱™,统计和机器学习工具箱™,深度学习工具箱.

卷积神经网络需要深度学习工具箱. CUDA支持训练和预测金宝app®具有3.0或更高计算能力的GPU。强烈推荐使用GPU,并要求使用GPU并行计算工具箱™.

视频

例子和如何做

软件参考