本页提供了MATLAB中的深度学习层列表®.
要了解如何从层为不同任务创建网络,请参见以下示例。
任务 | 了解更多 |
---|---|
为图像分类或回归创建深度学习网络。 | |
为序列和时间序列数据创建深度学习网络。 | |
创建音频数据深度学习网络。 | 基于深度学习的语音指令识别 |
为文本数据创建深度学习网络。 |
使用以下函数创建不同的图层类型。或者,使用深网络设计师应用程序以交互方式创建网络。
要了解如何定义自己的自定义层,请参见定义自定义深度学习层.
层 | 描述 |
---|---|
图像输入层向网络输入二维图像并应用数据归一化。 | |
三维图像输入层将三维图像或体积输入到网络并应用数据规范化。 | |
序列输入层将序列数据输入到网络。 | |
特征输入层将特征数据输入到网络,并进行数据规范化。当您拥有表示特征(不含空间或时间维度的数据)的数字标量数据集时,请使用此层。 | |
|
ROI输入层将图像输入到快速R-CNN对象检测网络。 |
层 | 描述 |
---|---|
一维卷积层将滑动卷积滤波器应用于一维输入。 | |
2-D卷积层将滑动卷积滤波器应用于2-D输入。 | |
三维卷积层将滑动立方卷积滤波器应用于三维输入。 | |
二维分组卷积层将输入通道分成若干组并应用滑动卷积滤波器。使用分组卷积层进行通道可分离(也称为深度可分离)卷积。 | |
转置的二维卷积层对特征地图进行上采样。 | |
转置三维卷积层对三维特征图进行上采样。 | |
一个完全连接的层将输入乘以一个权重矩阵,然后添加一个偏置向量。 |
层 | 描述 |
---|---|
序列输入层将序列数据输入到网络。 | |
LSTM层学习时间序列中时间步长与序列数据之间的长期依赖关系。 | |
双向LSTM (BiLSTM)层学习时间序列或序列数据的时间步长之间的双向长期依赖关系。当您希望网络在每个时间步骤中从完整的时间序列中学习时,这些依赖项可能会很有用。 | |
GRU层学习时间序列和序列数据中时间步之间的依赖关系。 | |
一维卷积层将滑动卷积滤波器应用于一维输入。 | |
一维最大池层通过将输入划分为一维池区域,然后计算每个区域的最大值来执行下采样。 | |
一维平均池层通过将输入划分为一维池区域,然后计算每个区域的平均值来执行下采样。 | |
一维全局最大池化层通过输出输入的最大时间或空间维度来执行向下采样。 | |
序列折叠层将一批图像序列转换为一批图像。使用序列折叠层独立地对图像序列的时间步长执行卷积运算。 | |
序列展开层恢复序列折叠后输入数据的序列结构。 | |
扁平层将输入的空间尺寸塌陷到通道尺寸中。 | |
|
嵌入层映射到向量中的Word Indices。 |
|
层 | 描述 |
---|---|
ReLU层对输入的每个元素执行一个阈值操作,其中任何小于零的值都被设置为零。 | |
一个泄漏的ReLU层执行一个阈值操作,其中任何小于零的输入值乘以一个固定标量。 | |
剪切的Relu层执行阈值操作,其中小于零的任何输入值被设置为零,并且在上方的任何值剪裁天花板被设置在了天花板上。 | |
ELU激活层对正输入执行恒等式运算,对负输入执行指数非线性运算。 | |
双曲正切(tanh)激活层将tanh函数应用于层输入。 | |
swish激活层将swish功能应用于层输入。 | |
|
softplus层应用softplus激活功能Y=对数(1+e)X),这确保了输出始终为正。这种激活功能是一个平滑的连续版本雷卢耶 .您可以将此层纳入深度神经网络,为加固学习代理中的演员定义。该层是用于创建连续高斯政策深神经网络,的量,标准偏差输出必须为正有用。 |
功能层将指定的功能应用于输入层。 | |
|
窥孔LSTM层是LSTM层的一种变体,其中门计算使用层单元状态。 |
层 | 描述 |
---|---|
批量归一化层独立地将每个通道的所有观察结果归一批数据。为了加速卷积神经网络的训练,降低对网络初始化的敏感性,在卷积层和非线性之间使用批量归一化层,例如Relu层。 | |
组归一化层独立地将每个观察分组的频道子集的分组子集中的迷你批次数据进行规范化。为了加快卷积神经网络的培训,降低对网络初始化的敏感性,在卷积层和非线性之间使用群标准化层,例如relu层。 | |
实例归一化层在每个通道上正常化每个通道的迷你数据。为了提高训练卷积神经网络的收敛性和减少对网络超参数,卷积层和非线性,如RELU层之间使用实例正常化层的灵敏度。 | |
层归一化层独立地将每个观察跨越所有通道的百分比数据。加快经常训练和多层感知神经网络和减少可学习层,例如LSTM和完全连接层之后到网络初始化,使用层正常化层的灵敏度。 | |
信道局部响应(跨信道)规范化层执行信道规范化。 | |
退出层以给定的概率将输入元素随机设置为零。 | |
2-D裁剪层将2-D裁剪应用于输入。 | |
三维裁剪层将三维体积裁剪为输入要素地图的大小。 | |
|
缩放层线性缩放和偏移输入阵列U ,给出一个输出y =比例。* u +偏见 .您可以将此层纳入深度神经网络,您可以为加固学习代理中的演员或批评者定义。该层对于缩放和移位非线性层的输出是有用的,例如坦莱尔 还有乙状结肠。 |
|
二次层接受输入向量并输出由输入元素构成的二次单项式向量。当您需要一个输出为其输入的某个二次函数的层时,该层非常有用。例如,重新创建二次值函数的结构,如LQR控制器设计中使用的函数。 |
|
2d调整大小层通过比例因子调整2d输入的大小,使其达到指定的高度和宽度,或参考输入特征图的大小。 |
|
三维调整大小图层按比例因子调整三维输入的大小,调整到指定的高度、宽度和深度,或调整到参考输入要素地图的大小。 |
|
STFT层计算输入的短时傅里叶变换。 |
层 | 描述 |
---|---|
一维平均池层通过将输入划分为一维池区域,然后计算每个区域的平均值来执行下采样。 | |
二维平均池层通过将输入划分为矩形池区域,然后计算每个区域的平均值来执行下采样。 | |
三维平均池层通过将三维输入划分为长方体池区域,然后计算每个区域的平均值来执行下采样。 | |
一维全局平均池化层通过输出输入的时间或空间维度的平均值来执行向下采样。 | |
通过计算输入的高度和宽度尺寸的平均值,2-D全局平均池化层执行下采样。 | |
三维全局平均池化层通过计算输入的高度、宽度和深度维度的平均值来执行下采样。 | |
一维最大池层通过将输入划分为一维池区域,然后计算每个区域的最大值来执行下采样。 | |
二维最大池化层通过将输入分割成矩形池化区域,然后计算每个区域的最大值来进行向下采样。 | |
三维最大池层通过将三维输入划分为长方体池区域,然后计算每个区域的最大值来执行下采样。 | |
一维全局最大池化层通过输出输入的最大时间或空间维度来执行向下采样。 | |
通过计算输入的高度和宽度尺寸的最大值,将2-D全局最大池池层执行下采样。 | |
三维全局最大池层通过计算输入的高度、宽度和深度维度的最大值来执行下采样。 | |
一个2d最大非池化层将取消池化一个2d最大池化层的输出。 |
层 | 描述 |
---|---|
加法层以元素的方式增加来自多个神经网络层的输入。 | |
乘法层将来自多个神经网络层的输入按元素相乘。 | |
深度级联层采用具有相同高度和宽度的输入,并沿着第三尺寸(通道维度)连接它们。 | |
连接层接受输入并沿指定维度连接它们。除了连接维度外,输入在所有维度中的大小都必须相同。 | |
|
加权加法层按元素扩展并添加来自多个神经网络层的输入。 |
层 | 描述 |
---|---|
|
ROI输入层将图像输入到快速R-CNN对象检测网络。 |
|
ROI最大池化层为输入特征图中的每个矩形ROI输出固定大小的特征图。使用这一层创建一个快速或更快的R-CNN对象检测网络。 |
|
ROI对齐层为输入特征图中的每个矩形ROI输出固定大小的特征图。使用该层创建掩码R-CNN网络。 |
|
锚盒层存储用于对象检测网络的特征图的锚盒。 |
|
区域提议层在更快的R-CNN内输出图像中的潜在对象周围的潜在对象周围的潜在对象(RPN)。 |
|
SSD合并层合并特征图的输出,用于后续回归和分类损失计算。 |
卵黄转移膜 (计算机视觉工具箱) |
you only look once version 2(YOLO v2)网络的变换层将网络中最后一个卷积层的边界框预测变换为落在地面真实值的范围内。使用转换层提高YOLO v2网络的稳定性。 |
|
空间到深度层将输入的空间块置换为深度维度。当您需要在不丢弃任何特征数据的情况下组合不同大小的特征图时,可以使用此层。 |
|
二维深度到空间层将深度维度的数据排列为二维空间数据块。 |
|
区域建议网络(RPN)softmax层将softmax激活功能应用于输入。使用此层创建更快的R-CNN对象检测网络。 |
|
焦点损耗层使用焦点损耗预测对象类。 |
|
区域建议网络(RPN)分类层将图像区域分类为对象或出身背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 |
|
通过使用平滑的L1损耗功能,盒回归层炼制边界框位置。使用这一层创建一个快速或更快的R-CNN对象检测网络。 |
层 | 描述 |
---|---|
Softmax层将SoftMax函数应用于输入。 | |
sigmoid层将sigmoid函数应用于输入,以使输出在间隔(0,1)内有界。 | |
分类层计算具有互斥类的分类和加权分类任务的跨熵丢失。 | |
回归层计算回归任务的半均方误差损失。 | |
|
像素分类层为每个图像像素或体素提供分类标签。 |
|
骰子像素分类层使用广义骰子丢失为每个图像像素或体素提供分类标签。 |
|
焦点损耗层使用焦点损耗预测对象类。 |
|
区域建议网络(RPN)softmax层将softmax激活功能应用于输入。使用此层创建更快的R-CNN对象检测网络。 |
|
区域建议网络(RPN)分类层将图像区域分类为对象或出身背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 |
|
通过使用平滑的L1损耗功能,盒回归层炼制边界框位置。使用这一层创建一个快速或更快的R-CNN对象检测网络。 |
|
you only look once version 2(YOLO v2)网络的输出层通过最小化预测位置和地面真相之间的均方误差损失来细化边界框位置。 |
|
Tversky像素分类层使用Tversky丢失为每个图像像素或体素提供分类标签。 |
|
分类SSE层计算分类问题的平方误差之和。 |
|
回归MAE层计算回归问题的平均绝对误差损失。 |