本页提供了MATLAB中的深度学习层列表®.
要了解如何从层中创建不同任务的网络,请参见以下示例。
任务 | 了解更多 |
---|---|
创建用于图像分类或回归的深度学习网络。 | |
为序列和时间序列数据创建深度学习网络。 | |
为音频数据创建深度学习网络。 | 基于深度学习的语音指令识别 |
为文本数据创建深度学习网络。 |
使用下面的函数创建不同的层类型。或者,使用深度网络设计器交互式创建网络的应用程序。
若要了解如何定义自己的自定义层,请参见定义自定义深度学习层.
层 | 描述 |
---|---|
图像输入层将2-D图像输入到网络并应用数据规范化。 | |
三维图像输入层将三维图像或卷输入网络并进行数据规范化。 | |
序列输入层向网络输入序列数据。 | |
特征输入层将特征数据输入网络并进行数据规范化。当您拥有表示特征的数值标量数据集(没有空间或时间维度的数据)时,请使用此层。 | |
|
ROI输入层将图像输入到快速R-CNN对象检测网络。 |
层 | 描述 |
---|---|
1-D卷积层对1-D输入应用滑动卷积滤波器。 | |
二维卷积层对二维输入应用滑动卷积滤波器。 | |
三维卷积层对三维输入应用滑动立方卷积滤波器。 | |
二维分组卷积层将输入通道分成组,并应用滑动卷积滤波器。使用分组卷积层进行通道可分离(也称为深度可分离)卷积。 | |
转置二维卷积层上采样特征图。 | |
转置的三维卷积层向上采样三维特征图。 | |
全连接层将输入乘以权重矩阵,然后添加偏置向量。 |
层 | 描述 |
---|---|
序列输入层向网络输入序列数据。 | |
LSTM层学习时间序列和序列数据中时间步长之间的长期依赖关系。 | |
双向LSTM (BiLSTM)层学习时间序列或序列数据的时间步长之间的双向长期依赖关系。当您希望网络在每个时间步骤中都能从完整的时间序列中学习时,这些依赖关系非常有用。 | |
GRU层学习时间序列和序列数据中时间步长之间的依赖关系。 | |
1-D卷积层对1-D输入应用滑动卷积滤波器。 | |
1-D最大池化层通过将输入划分为1-D池化区域,然后计算每个区域的最大值来进行下采样。 | |
1-D平均池化层通过将输入划分为1-D池化区域来执行下采样,然后计算每个区域的平均值。 | |
1-D全局最大池化层通过输出输入的时间或空间维度的最大值来执行下采样。 | |
序列折叠层将一批图像序列转换为一批图像。使用序列折叠层对图像序列的时间步长进行独立的卷积运算。 | |
序列展开层在序列折叠后恢复输入数据的序列结构。 | |
平坦层将输入的空间维度折叠为通道维度。 | |
|
单词嵌入层将单词索引映射到向量。 |
|
层 | 描述 |
---|---|
ReLU层对输入的每个元素执行阈值操作,其中任何小于零的值都被设置为零。 | |
泄漏的ReLU层执行阈值操作,其中任何小于零的输入值都乘以一个固定的标量。 | |
剪切的ReLU层执行阈值操作,其中任何小于零的输入值都被设置为零,任何高于零的输入值都被设置为零剪裁天花板被设定在那个裁剪的天花板上。 | |
ELU激活层对正输入执行恒等运算,对负输入执行指数非线性。 | |
双曲正切(tanh)激活层对层输入应用tanh函数。 | |
swish激活层对层输入应用swish函数。 | |
|
softplus层应用softplus激活函数Y= log(1 + e)X),确保输出总是正的。这个激活函数是一个平滑连续的版本reluLayer .您可以将此层合并到为强化学习代理中的参与者定义的深度神经网络中。这一层用于创建连续高斯策略深度神经网络,其标准偏差输出必须为正。 |
函数层对层输入应用指定的函数。 | |
|
窥视孔LSTM层是LSTM层的变体,其中栅极计算使用层单元状态。 |
层 | 描述 |
---|---|
批处理归一层对每个通道的所有观测数据分别进行小批处理。为了加快卷积神经网络的训练并降低对网络初始化的敏感性,在卷积层和非线性层之间使用批量归一化层,如ReLU层。 | |
分组归一层对每个观测数据在分组的通道子集上单独归一小批数据。为了加快卷积神经网络的训练并降低对网络初始化的敏感性,在卷积层和非线性层之间使用组归一化层,如ReLU层。 | |
实例归一层为每个观察单独地在每个通道上归一小批数据。为了提高卷积神经网络训练的收敛性并降低对网络超参数的敏感性,在卷积层和非线性层之间使用实例归一化层,如ReLU层。 | |
层归一化层对每个观测数据单独地在所有通道上归一小批数据。为了加快循环和多层感知器神经网络的训练,降低网络初始化的敏感性,在可学习层之后使用层归一化层,如LSTM和全连接层。 | |
信道局部响应(跨信道)归一层执行信道归一化。 | |
dropout层以给定的概率随机地将输入元素设置为零。 | |
2-D作物层对输入应用2-D作物。 | |
3-D作物层将3-D体积作物到输入特征映射的大小。 | |
|
缩放层对输入数组进行线性缩放和偏置U ,给出一个输出Y =刻度。*U +偏置 .您可以将这一层合并到为强化学习代理中的演员或评论家定义的深度神经网络中。该层用于缩放和移动非线性层的输出,例如tanhLayer 和乙状结肠。 |
|
二次层取一个输入向量,输出一个由输入元素构成的二次单项向量。当你需要一个输出为输入二次函数的层时,这个层很有用。例如,重建二次值函数的结构,如在LQR控制器设计中使用的那些。 |
|
2-D调整层通过比例因子调整2-D输入的大小,到指定的高度和宽度,或者到参考输入特征映射的大小。 |
|
3-D调整大小层根据比例因子调整3-D输入的大小,调整到指定的高度、宽度和深度,或者调整到参考输入特征映射的大小。 |
|
STFT层计算输入的短时傅里叶变换。 |
层 | 描述 |
---|---|
1-D平均池化层通过将输入划分为1-D池化区域来执行下采样,然后计算每个区域的平均值。 | |
二维平均池化层通过将输入划分为矩形池化区域,然后计算每个区域的平均值来进行下采样。 | |
三维平均池化层通过将三维输入划分为立方池化区域进行下采样,然后计算每个区域的平均值。 | |
1-D全局平均池化层通过输出输入的时间或空间维度的平均值来执行下采样。 | |
2-D全局平均池化层通过计算输入的高度和宽度维度的平均值来执行下采样。 | |
三维全局平均池化层通过计算输入的高度、宽度和深度维度的平均值来执行下采样。 | |
1-D最大池化层通过将输入划分为1-D池化区域,然后计算每个区域的最大值来进行下采样。 | |
二维最大池化层通过将输入划分为矩形池化区域,然后计算每个区域的最大值来进行下采样。 | |
三维最大池化层通过将三维输入划分为立方池化区域,然后计算每个区域的最大值来进行下采样。 | |
1-D全局最大池化层通过输出输入的时间或空间维度的最大值来执行下采样。 | |
2-D全局最大池化层通过计算输入的高度和宽度维度的最大值来执行下采样。 | |
3-D全局最大池化层通过计算输入的高度、宽度和深度维度的最大值来执行下采样。 | |
2-D最大池化层将2-D最大池化层的输出解池。 |
层 | 描述 |
---|---|
添加层按元素添加来自多个神经网络层的输入。 | |
乘法层将来自多个神经网络层的输入按元素进行乘法。 | |
深度连接层接受具有相同高度和宽度的输入,并沿着第三维(通道维)将它们连接起来。 | |
连接层接受输入并按照指定的维度连接它们。除了连接维度外,所有维度的输入都必须具有相同的大小。 | |
|
加权加法层按元素扩展并添加来自多个神经网络层的输入。 |
层 | 描述 |
---|---|
|
ROI输入层将图像输入到快速R-CNN对象检测网络。 |
|
ROI最大池化层为输入特征图中的每个矩形ROI输出固定大小的特征图。使用此层创建一个Fast或Faster R-CNN对象检测网络。 |
|
ROI对齐层为输入特征图中的每个矩形ROI输出固定大小的特征图。使用这个图层创建一个蒙版R-CNN网络。 |
|
锚盒层存储用于对象检测网络的特征映射的锚盒。 |
|
区域建议层输出图像中潜在对象周围的边界框,作为Faster R-CNN中的区域建议网络(RPN)的一部分。 |
|
SSD合并层合并特征映射的输出,用于后续的回归和分类损失计算。 |
yolov2TransformLayer (计算机视觉工具箱) |
你只看一次版本2 (YOLO v2)网络的转换层将网络中最后一个卷积层的边界框预测转换到ground truth的边界内。使用转换层来提高YOLO v2网络的稳定性。 |
|
空间到深度层将输入的空间块排列到深度维度中。当您需要在不丢弃任何特征数据的情况下组合不同大小的特征映射时使用此层。 |
|
2-D深度到空间层将深度维度的数据排列成2-D空间数据块。 |
|
区域提议网络(RPN)软最大层对输入应用软最大激活函数。使用此层创建一个Faster R-CNN对象检测网络。 |
|
焦点损失层使用焦点损失预测对象类别。 |
|
区域建议网络(RPN)分类层对图像区域进行分类对象或背景通过使用交叉熵损失函数。使用此层创建一个Faster R-CNN对象检测网络。 |
|
盒回归层通过使用平滑L1损失函数来细化边界盒位置。使用此层创建一个Fast或Faster R-CNN对象检测网络。 |
层 | 描述 |
---|---|
softmax层对输入应用一个softmax函数。 | |
sigmoid层对输入应用sigmoid函数,使输出以(0,1)区间为界。 | |
分类层计算具有互斥类的分类和加权分类任务的交叉熵损失。 | |
回归层计算回归任务的半均方误差损失。 | |
|
像素分类层为每个图像像素或体素提供分类标签。 |
|
Dice像素分类层使用广义Dice损失为每个图像像素或体素提供分类标签。 |
|
焦点损失层使用焦点损失预测对象类别。 |
|
区域提议网络(RPN)软最大层对输入应用软最大激活函数。使用此层创建一个Faster R-CNN对象检测网络。 |
|
区域建议网络(RPN)分类层对图像区域进行分类对象或背景通过使用交叉熵损失函数。使用此层创建一个Faster R-CNN对象检测网络。 |
|
盒回归层通过使用平滑L1损失函数来细化边界盒位置。使用此层创建一个Fast或Faster R-CNN对象检测网络。 |
|
版本2 (YOLO v2)网络的输出层通过最小化预测位置和地面真相之间的均方误差损失来细化边界框位置。 |
|
特维斯基像素分类层使用特维斯基损失为每个图像像素或体素提供分类标签。 |
|
分类SSE层计算分类问题的平方和误差损失。 |
|
回归MAE层计算回归问题的平均绝对误差损失。 |
trainingOptions
|trainNetwork
|深度网络设计器