网络体系结构定义了深度学习模型的结构方式,更重要的是定义了它的设计目的。体系结构将决定:
在选择网络体系结构之前,了解您拥有的用例类型和可用的公共网络非常重要。
在深入学习时,您可能会遇到这些常见的架构:
•卷积神经网络(CNN):CNNS通常与图像相关联作为输入数据,但它们也可以用于其他输入数据,我将进入问题1中的这些细节。
•经常性神经网络(RNN):RNN具有跟踪以前的信息以使未来预测的连接。与CNN不同,其中每个输入被假定为独立的事件,RNN可以处理可能影响对方的数据序列。一个例子是自然语言处理,其中之前的单词影响了接下来是什么的可能性。
•长短期内存(LSTM):LSTM网络是序列和信号数据的常用RNN。我会在问题3中进行更详细的细节。
非常好的问题。最简单的答案就是你大概想让CNN对图像进行分类。
这就是为什么。
让我们从CNN和LSTM网络是什么开始,以及它们通常是如何使用的。
谈论卷积神经网络时,有人说“Convnet”,但每当我尝试在谈话中丢弃时,我总是觉得我在我实际上没有。
cnn由许多层组成,但遵循某种类似于卷积| ReLU |池化的模式,它会一次又一次地重复。它们在图像分类中非常有用,因为它们在局部空间模式匹配方面非常出色,而且在图像特征提取方面通常也优于其他方法。请记住cnn的核心是卷积.将输入图像与一系列滤波器进行卷积可以突出图像中的特征,而不会损失相邻像素之间的空间交互作用。
这个主题有很多变体,但cnn常见的配置如下:
长短期内存网络主要与时间序列和序列数据相关联。LSTM网络记得在做出决策之前的一些部分 - 他们在上下文中看到数据,这有助于提高关联。
该图说明了一个简单的LSTM网络分类:
时间序列回归场景#2:我有来自多个传感器的数据,并希望预测剩余的使用寿命(机器在需要修理或更换之前的时间量)。
我的同事和我在工业自动化领域的客户身上看到了这个问题,他们需要在问题变得危险或昂贵之前发现问题。这次,您可能希望使用LSTM网络而不是机器学习回归。这种方法减少了手动识别特征的需要,而手动识别特征对于多个传感器来说是一项重要的任务。
时间序列回归场景#3我有音频数据,我想去噪。
这里你可以用CNN。这种方法的重要之处在于,在将信号传输到网络之前,先将它们转换成图像。这意味着信号通过傅里叶变换或其他时频处理变成图像表示。使用图像提供了一种查看特征的方法,你可能无法在原始信号中可视化。由于傅里叶变换本质上是一幅图像,因此使用的网络可以是为图像设计的预先训练的网络。
现在,再一次,你可以做你想做的。您也很可能在场景1中使用LSTM网络,或者在场景2中使用CNN。这些场景只是为了给您一个起点。
网络架构和预先训练的网络是齐头并进的。预训练模型是一个经过训练的神经网络。根据输入数据调整网络的权重和偏差,可以更快地对网络进行再训练,以适应新的任务。这个过程称为迁移学习,有时需要更少的图像,使用更小的数据集。另一种探索方法是通过模拟或增强“创造”更多数据。
目前,我会说,您应该使用您想要的任何网络,无论数据集大小如何,都要考虑使用佩带的网络需要更少的输入数据,或者考虑增强数据集的方法。我的下一列将涵盖掠夺网络和模型,因此请在此主题上留意。