卷积神经网络

你需要知道三件事

什么是卷积神经网络?

卷积神经网络(CNN或ConvNet)是最流行的算法之一深度学习,这是一种机器学习,其中模型学习直接从图像、视频、文本或声音中执行分类任务。

cnn在寻找图像模式以识别物体、面孔和场景方面特别有用。它们直接从图像数据中学习,使用模式对图像进行分类,而不需要手动提取特征。

应用程序需要对象识别计算机视觉——如无人驾驶车辆人脸识别的应用——非常依赖cnn。根据您的应用程序,您可以从头构建CNN,或使用预先训练的模型与您的数据集。

cnn为何如此有用?

由于三个重要因素,使用cnn进行深度学习变得越来越流行:

  • CNN消除了人工提取特征的需要——特征直接由CNN学习。
  • cnn提供最先进的识别结果。
  • cnn可以接受重新培训,以完成新的识别任务,使您能够在已有的网络上进行构建。

深度学习工作流程。图像被传递给CNN, CNN会自动学习特征并对物体进行分类。

cnn使目标检测和目标识别取得进展

cnn为图像识别和模式检测提供了一个优化的体系结构。结合gpu和并行计算的进步,cnn是自动驾驶和面部识别新发展的关键技术。

例如,深度学习应用程序使用cnn检查数千份病理报告,以视觉检测癌细胞。cnn还使自动驾驶汽车能够探测物体,并学会区分路牌和行人。

了解更多

cnn是如何工作的

卷积神经网络可以有数十或数百层,每层都学习检测图像的不同特征。对每一幅不同分辨率的训练图像进行滤波,每一幅卷积图像的输出作为下一层的输入。金宝搏官方网站过滤器可以从非常简单的特征开始,如亮度和边缘,并增加复杂性,以唯一定义对象的特征。

cnn对图像、文本、声音和视频进行特征识别和分类。

特征学习、层和分类

像其他神经网络一样,CNN由一个输入层、一个输出层和许多隐藏层组成。

这些层执行改变数据的操作,目的是学习特定于数据的特性。最常见的三层是:卷积、激活(ReLU)和池化。

  • 卷积将输入的图像通过一组卷积过滤器,每个过滤器激活图像的某些特征。
  • 整流线性单元(ReLU)通过将负值映射为零并保持正值,可以实现更快、更有效的训练。这有时被称为激活,因为只有激活的特征才会进入下一层。
  • 通过执行非线性下采样简化输出,减少网络需要学习的参数数量。

这些操作在数十层或数百层中重复,每一层学习识别不同的特征。

具有许多卷积层的网络示例。对每一幅不同分辨率的训练图像进行滤波,每一幅卷积图像的输出作为下一层的输入。金宝搏官方网站

分类层

在多层学习特征后,CNN的架构转向分类。

倒数一层是一个完全连接的层,输出K维向量,其中K是网络能够预测的类的数量。这个向量包含任何图像被分类的每一类的概率。

CNN体系结构的最后一层使用诸如softmax之类的分类层来提供分类输出。

gpu硬件加速

卷积神经网络是在成百上千甚至上百万的图像上训练的。当处理大量数据和复杂的网络架构时,gpu可以显著加快处理时间来训练模型。一旦CNN经过训练,它就可以用于实时应用,如高级驾驶员辅助系统(ADAS)中的行人检测。

使用MATLAB与CNN

使用MATLAB®深度学习工具箱™使您可以从头开始训练你自己的CNN或者使用pretrained模型执行转移学习

选择哪种方法取决于可用资源和正在构建的应用程序类型。

要从头开始训练网络,架构师需要定义层和过滤器的数量,以及其他可调参数。从头开始训练一个准确的模型还需要大量的数据,大约有数百万个样本,这可能会花费大量的时间。

从头开始训练CNN的一种常见的替代方法是使用预先训练过的模型从新的数据集自动提取特征。调用这个方法,转移学习是一种不需要庞大数据集和长计算和训练时间的方便应用深度学习的方法。

从头开始培训

从头创建网络意味着确定网络配置。这种方法可以最大限度地控制网络,并能产生令人印象深刻的结果,但它需要理解网络的结构神经网络以及图层类型和配置的许多选项。

虽然结果有时可能超过迁移学习(见下文),但这种方法往往需要更多的图像来训练,因为新的网络需要许多对象的例子来理解特征的变化。训练时间通常较长,而且网络层的组合太多,从头开始配置网络可能会让人不知所措。通常,在构建网络和组织层时,参考其他网络配置有助于利用研究人员已经证明成功的配置。

了解更多

使用预先训练的模型进行迁移学习

对预先训练好的网络进行微调转移学习通常比从头开始训练更快更容易。它需要最少的数据量和计算资源。迁移学习用一种问题中的知识来解决类似的问题。你从一个预先训练过的网络开始,用它来学习一项新任务。迁移学习的一个优点是,预先训练的网络已经学习了一组丰富的特征。这些特性可以应用于其他类似的任务。例如,你可以在数百万张图像上训练一个网络,然后再使用数百张图像对它进行新的目标分类。

使用深度学习工具箱,您可以执行迁移学习与预先训练的CNN模型(如GoogLeNet, AlexNet, vgg16, vgg19)和模型从Caffe和TensorFlow-Keras。

了解更多

应用程序使用有线电视新闻网

对象检测

目标检测是对图像和视频中的目标进行定位和分类的过程。计算机视觉工具箱™提供训练框架,使用R-CNN(带有CNN的区域)、Fast R-CNN和Faster R-CNN创建基于深度学习的对象检测器。

你可以使用机器学习技术统计和机器学习工具箱™用计算机视觉工具箱创建物体识别系统。

深度学习工具箱提供的功能构建和培训cnn,以及用训练有素的CNN模型进行预测。

这个例子展示了如何使用深度学习和R-CNN(卷积神经网络区域)训练目标检测器。
这个例子展示了如何使用名为Faster R-CNN(卷积神经网络区域)的深度学习技术训练目标检测器。

如何更多地了解cnn

下载188bet金宝搏支持使金宝app用cnn进行图像分析的产品包括MATLAB计算机视觉系统工具箱统计和机器学习工具箱,深度学习工具箱

卷积神经网络的要求深度学习工具箱.CUDA支持训练和预测金宝app®具有3.0或更高计算能力的GPU。建议使用GPU,这是必须的并行计算工具箱™

软件参考

免费试用

30天的探索触手可及。

有问题吗?

与深度学习专家交谈。