卷积神经网络

你需要知道的3件事

一个卷积神经网络(CNN或ConvNet),是一种网络架构深度学习它直接从数据中学习,消除了手工特征提取的需要。

CNNS特别适用于在图像中查找模式以识别对象,面部和场景。它们也可以非常有效地对音频,时间序列和信号数据等非图像数据进行分类。

要求对象识别计算机视觉- 如无人驾驶车辆和人脸识别应用——严重依赖cnn。

cnn为什么这么有用?

由于三个重要因素,使用CNN为深度学习而流行:

  • CNN消除了人工提取特征的需要——特征直接由CNN学习。
  • CNN产生高度准确的识别结果。
  • 可以侦听CNN,以获取新的识别任务,使您能够在预先存在的网络上构建。

cnn为发现和学习图像和时间序列数据中的关键特征提供了一个最优的体系结构。cnn是一个关键的应用技术,如:

  • 医学成像cnn可以检查数以千计的病理报告,以视觉检测图像中癌细胞的存在或不存在。
  • 音频处理:关键字检测可以在任何带有麦克风的设备中使用,以检测出一个单词或短语时 - ('嘿Siri!')。无论环境如何,CNN都可以准确地学习和检测关键字,而忽略所有其他短语。
  • 停车标志检测:自动驾驶依靠cnn精确检测标识或其他物体的存在,并根据输出做出决策。
  • 合成数据生成:使用生成对抗网络(GANs),可以生产用于深度学习应用的新图像,包括面部识别和自动驾驶。

学到更多

cnn是如何工作的

卷积神经网络可以有数十或数百层,每一层都可以学习检测图像的不同特征。滤波器应用于每幅不同分辨率的训练图像,每幅卷积图像的输出被用作下一层的输入。金宝搏官方网站滤镜可以从非常简单的特征开始,比如亮度和边缘,然后增加特征的复杂性,以唯一地定义对象。

特征学习,图层和分类

与其他神经网络类似,CNN由输入层,输出层和之间的许多隐藏层组成。

这些图层执行更改数据的操作,其中包含特定于数据的学习功能。最常见的三层是:卷积,激活或释放和汇集。

  • 卷积将输入图像通过一组卷积滤波器,每个卷积滤波器激活图像的某些特征。
  • 整流线性单元(ReLU)通过将负值映射为零并保持正值,允许更快更有效的训练。这有时被称为激活,因为只有激活的功能将被转发到下一个层中。
  • 通过执行非线性下采样来简化输出,减少网络需要学习的参数数量。

这些操作重复超过数十或数百层,每层学习都会识别不同的特征。

一个有许多卷积层的网络的例子。滤波器应用于每幅不同分辨率的训练图像,每幅卷积图像的输出被用作下一层的输入。金宝搏官方网站

共享权重和偏见

像一个传统神经网络CNN的神经元具有权重和偏差。该模型在训练过程中学习这些值,并随着每一个新的训练实例不断更新这些值。而在cnn的情况下,给定层中所有隐藏神经元的权值和偏差值都是相同的。

这意味着所有隐藏的神经元在图像的不同区域中检测到相同的特征,例如边缘或斑点。这使得网络容忍图像中对象的翻译。例如,训练识别汽车的网络将能够在汽车中的任何地方这样做。

分类层

在许多层中学习功能之后,CNN的体系结构转移到分类。

倒数第二层是完全连接层,它输出K维向量,其中K是网络能够预测的类数。这个向量包含每一类被分类的图像的概率。

CNN架构的最终层使用诸如SoftMax的分类层来提供分类输出。

利用MATLAB设计和训练cnn网络

使用MATLAB®深度学习工具箱™让你能够设计、训练和部署cnn。

MATLAB提供了大量来自深度学习社区的预训练模型,可用于学习和识别新数据集的特征。这种方法被称为迁移学习,是一种应用深度学习而无需从头开始的便捷方法。像GoogLeNet、AlexNet和Inception这样的模型提供了一个探索深度学习的起点,利用了专家构建的经过验证的体系结构。

设计和培训网络

使用Deep Network Designer,您可以导入预先训练过的模型或从头构建新的模型。

深度网络设计师应用程序,用于交互式,可视化和编辑深度学习网络。

您还可以在应用程序中直接培训网络,并通过准确性、损失和验证指标的图来监控培训。

使用训练前的迁移学习模型

微调预先训练的网络转移学习通常比从头划伤训练更快更容易。它需要最少的数据和计算资源。转移学习使用一种类型的知识来解决类似问题。您从备用网络开始,并使用它来学习新任务。转移学习的一个优点是佩带的网络已经学习了丰富的功能。这些功能可以应用于各种其他类似的任务。例如,您可以在数百万图像上培训网络,并使用数百个图像培训为新的对象分类。

硬件加速与gpu

卷积神经网络培训数百,数千甚至数百万图像。在使用大量数据和复杂的网络架构时,GPU可以显着速度加快处理时间来训练模型。

英伟达®GPU,它加速了像深度学习这样的计算密集型任务。

学到更多


应用程序使用CNNS.

对象检测

对象检测是在图像和视频中定位和分类对象的过程。计算机视觉工具箱™提供使用YOLO和更快的R-CNN创建基于深度学习的对象探测器的培训框架。

基于深度学习的目标检测

这个例子展示了如何使用深度学习和R-CNN(卷积神经网络区域)训练一个目标检测器。

关键字检测

语音文本转换的一个应用实例是关键字检测,它可以识别某些关键字或短语,并将它们用作指令。常见的例子是唤醒设备和打开灯。

基于深度学习的关键词检测

这个例子展示了如何使用MATLAB来识别和检测音频中语音命令的存在,并可用于语音辅助技术

语义分割

利用网络神经网络进行语义分割,对图像中的每个像素进行分类。语义分割可用于自动驾驶、工业检测、地形分类和医学成像等应用。卷积神经网络是构建语义分割网络的基础。

基于深度学习的语义切分

这个例子展示了如何使用MATLAB建立一个语义分割网络,它将识别图像中的每个像素与相应的标签。

MATLAB提供了一个工具和功能,为所有事情的深度学习。使用cnn来增强信号处理、计算机视觉或通信和雷达方面的工作流。


如何了解更多cnn信息

下载188bet金宝搏支持使金宝app用CNN进行图像分析的产品包括MATLAB计算机视觉工具箱™统计和机器学习工具箱™,深度学习工具箱

卷积神经网络需要深度学习工具箱。CUDA支持培训和预测金宝app®具有3.0或更高计算能力的GPU。强烈推荐并要求使用GPU并行计算工具箱™

视频

例子和如何

软件参考