卷积神经网络

你需要知道的3件事

卷积神经网络（CNN或ConvNet），是网络架构深度学习直接从数据学习，无需手动功能提取。

CNNS特别适用于在图像中查找模式以识别对象，面部和场景。它们也可以非常有效地对音频，时间序列和信号数据等非图像数据进行分类。

呼唤的应用程序对象识别和计算机视觉- 如自驾驶车辆和面部识别应用 - 严重依赖CNNS。

为什么CNNS很重要

他们如何工作

用matlab cnns

是什么让CNNS如此有用？

由于三个重要因素，使用CNN为深度学习而流行：

CNN消除了对手动特征提取的需求 - 通过CNN直接学习功能。
CNN产生高度准确的识别结果。
可以侦听CNN，以获取新的识别任务，使您能够在预先存在的网络上构建。

CNN为图像和时间序列数据中的揭示和学习关键特征提供了最佳架构。CNN是应用程序中的关键技术，如：

医学影像：CNN可以检查数千个病理报告，以在目视检测图像中的存在或不存在图像。
音频处理：关键字检测可以在任何带有麦克风的设备中使用，以检测出一个单词或短语时 - （'嘿Siri！'）。无论环境如何，CNN都可以准确地学习和检测关键字，而忽略所有其他短语。
停止标志检测：自动驱动依赖于CNNS，以准确地检测标志或其他对象的存在，并根据输出做出决定。
合成数据生成：使用生成的对抗网络（GANS），可以生产用于深度学习应用的新图像，包括面部识别和自动驾驶。

学到更多

为分类创建简单的深度学习网络

CNNS如何工作

卷积神经网络可以具有数十或数百层，每个层每个都学会检测图像的不同特征。过滤器以不同分辨率应用于每个训练图像，并且每个卷绕图像的输出用作下一个层的输入。金宝搏官方网站过滤器可以从诸如亮度和边缘的非常简单的功能开始，以及对唯一定义对象的功能的复杂性增加。

特征学习，图层和分类

与其他神经网络类似，CNN由输入层，输出层和之间的许多隐藏层组成。

这些图层执行更改数据的操作，其中包含特定于数据的学习功能。最常见的三层是：卷积，激活或释放和汇集。

卷积通过一组卷积滤波器将输入图像放置，每个卷积滤波器激活图像中的某些功能。
整流线性单元（Relu）允许通过将负值映射到零并保持正值来允许更快更有效的培训。这有时被称为激活，因为只有激活的功能将被转发到下一个层中。
汇集通过执行非线性下行采样来简化输出，从而减少网络需要学习的参数数。

这些操作重复超过数十或数百层，每层学习都会识别不同的特征。

具有许多卷积层的网络示例。过滤器以不同分辨率应用于每个训练图像，并且每个卷绕图像的输出用作下一个层的输入。金宝搏官方网站

共享权重和偏见

像传统一样神经网络，CNN具有具有重量和偏差的神经元。该模型在培训过程中学习这些值，并且它将其与每个新培训示例连续更新。然而，在CNNS的情况下，对给定层中的所有隐藏神经元的权重和偏置值是相同的。

这意味着所有隐藏的神经元在图像的不同区域中检测到相同的特征，例如边缘或斑点。这使得网络容忍图像中对象的翻译。例如，训练识别汽车的网络将能够在汽车中的任何地方这样做。

分类层

在许多层中学习功能之后，CNN的体系结构转移到分类。

接下来的层是一个完全连接的层，输出k尺寸的向量，其中k是网络将能够预测的类的数量。此矢量包含分类的每个类别的概率。

CNN架构的最终层使用诸如SoftMax的分类层来提供分类输出。

使用MATLAB设计和培训CNN

使用马铃薯^®和深度学习工具箱™让你能够设计，列车和部署CNN。

Matlab提供了一系列来自深度学习界的一组预磨损模型，可用于学习和识别新数据集的功能。这种称为传输学习的方法是应用深度学习的便捷方式，而无需从头开始。像googlenet，alexnet和成立的模型提供了探索深度学习的起点，利用专家建造的经过验证的架构。

设计和培训网络

使用Deep Network Designer，您可以导入备用模型或从头开始构建新型号。

深度网络设计师应用程序，用于交互式，可视化和编辑深度学习网络。

您还可以直接在应用程序中培训网络，并监控具有精度，丢失和验证度量的绘图的培训。

使用预磨料模型进行转移学习

微调掠夺网络转移学习通常比从头划伤训练更快更容易。它需要最少的数据和计算资源。转移学习使用一种类型的知识来解决类似问题。您从备用网络开始，并使用它来学习新任务。转移学习的一个优点是佩带的网络已经学习了丰富的功能。这些功能可以应用于各种其他类似的任务。例如，您可以在数百万图像上培训网络，并使用数百个图像培训为新的对象分类。