此页面提供了Matlab中的深度学习层列表®.
要了解如何从图层创建网络以获取不同的任务,请参阅以下示例。
任务 | 了解更多 |
---|---|
创建图像分类或回归的深度学习网络。 | |
为序列和时间序列数据创建深度学习网络。 | |
创建音频数据深度学习网络。 | 基于深度学习的语音指令识别 |
创建文本数据的深度学习网络。 |
使用以下函数创建不同的图层类型。或者,使用深层网络设计师应用程序以交互方式创建网络。
要了解如何定义自己的自定义层,请参见定义自定义深度学习层.
层 | 描述 |
---|---|
图像输入层向网络输入二维图像并应用数据归一化。 | |
3-D图像输入层将3-D图像或卷向网络输入并应用数据归一化。 | |
序列输入层将序列数据输入到网络。 | |
特征输入层将特征数据输入到网络,并进行数据规范化。当您拥有表示特征(不含空间或时间维度的数据)的数字标量数据集时,请使用此层。 | |
|
ROI输入层将图像输入到Fast R-CNN目标检测网络。 |
层 | 描述 |
---|---|
1-D卷积层将滑动卷积滤波器应用于1-D输入。 | |
二维卷积层将滑动卷积滤波器应用于二维输入。 | |
三维卷积层将滑动立方卷积滤波器应用于三维输入。 | |
2-D分组的卷积层将输入通道分开到组中并应用滑动卷轴滤波器。使用分组的卷积层,用于通道 - 明智的可分离(也称为深度明智的可分离)卷积。 | |
转置的2-D卷积层Upsamples特征图。 | |
翻转的3-D卷积层上叠层三维特征图。 | |
完全连接的层通过权重矩阵乘以输入,然后添加偏置向量。 |
层 | 描述 |
---|---|
序列输入层将序列数据输入到网络。 | |
LSTM层学习时间序列中时间步长与序列数据之间的长期依赖关系。 | |
双向LSTM (BiLSTM)层学习时间序列或序列数据的时间步长之间的双向长期依赖关系。当您希望网络在每个时间步骤中从完整的时间序列中学习时,这些依赖项可能会很有用。 | |
GRU层学习时间序列和序列数据的时间步骤之间的依赖性。 | |
1-D卷积层将滑动卷积滤波器应用于1-D输入。 | |
通过将输入划分为1-D池区域,然后计算每个区域的最大值,通过将输入分为1-d最大池池层进行下采样。 | |
通过将输入划分为1-D池区,然后计算每个区域的平均值来执行1-D平均池化层对下采样。 | |
一维全局最大池化层通过输出输入的最大时间或空间维度来执行向下采样。 | |
序列折叠层将一批图像序列转换为一批图像。使用序列折叠层独立地执行图像序列的时间步长进行卷积操作。 | |
序列展开层恢复序列折叠后输入数据的序列结构。 | |
扁平层将输入的空间维度折叠为通道维度。 | |
|
单词嵌入层将单词索引映射到向量。 |
|
层 | 描述 |
---|---|
ReLU层对输入的每个元素执行一个阈值操作,其中任何小于零的值都被设置为零。 | |
一个泄漏的ReLU层执行一个阈值操作,其中任何小于零的输入值乘以一个固定标量。 | |
被裁剪的ReLU层执行一个阈值操作,其中任何小于0的输入值都被设置为0,任何高于剪裁天花板被设置在了天花板上。 | |
ELU激活层对负输入上的正输入和指数非线性执行身份操作。 | |
双曲正切(tanh)激活层将tanh函数应用于层输入。 | |
速度激活层在图层输入上应用闪光灯功能。 | |
|
SoftPlus图层应用SoftPlus激活功能Y= log(1 + eX),以确保输出总是正的。这个激活函数是一个平滑连续的剥离 .你可以将这一层整合到你为强化学习代理中的参与者定义的深度神经网络中。这一层对于创建连续高斯策略深度神经网络非常有用,对于这种神经网络,标准差输出必须为正。 |
函数图层将指定的功能应用于图层输入。 | |
|
窥孔LSTM层是LSTM层的一种变体,其中门计算使用层单元状态。 |
层 | 描述 |
---|---|
批处理归一化层对每个通道的所有观测数据进行独立的归一化。为了加快卷积神经网络的训练,降低对网络初始化的敏感性,在卷积层和非线性层之间使用批处理归一化层,如ReLU层。 | |
组归一化层对每个观测的跨信道分组子集的小批数据进行独立归一化。为了加快卷积神经网络的训练,降低对网络初始化的敏感性,可以在卷积层和非线性层之间使用群归一化层,如ReLU层。 | |
实例规格化层对每个观测的每个通道上的小批数据进行独立的规格化。为了提高卷积神经网络训练的收敛性,降低对网络超参数的敏感性,在卷积层和非线性层之间使用实例归一化层,如ReLU层。 | |
一层规格化层对每个观测的所有通道的小批数据进行独立的规格化。为了加快递归多层感知器神经网络的训练,降低对网络初始化的敏感性,可以在可学习层之后再使用层归一化层,如LSTM和全连接层。 | |
频道明智的本地响应(跨通道)归一化层执行通道明智的归一化。 | |
丢弃层随机将输入元素随机设置为零,具有给定的概率。 | |
2-D作物层应用2-D裁剪输入。 | |
3-D裁剪层将3-D体积作物为输入特征图的大小。 | |
|
缩放层线性地缩放并偏置输入数组U ,给出输出Y =。* U +偏见 .你可以将这一层整合到你在强化学习代理中为参与者或批评者定义的深度神经网络中。这一层用于缩放和移动非线性层的输出,例如坦希尔 和乙状体。 |
|
二次层采用输入向量,并输出由输入元件构成的二次单体的向量。当您需要输出是其输入的一些二次函数时,此图层很有用。例如,要重新创建二次值函数的结构,例如LQR控制器设计中使用的功能。 |
|
2d调整大小层通过比例因子调整2d输入的大小,使其达到指定的高度和宽度,或参考输入特征图的大小。 |
|
3-D调整层的大小将3-D通过比例因子调整为3-D输入,指定高度,宽度和深度,或参考输入特征映射的大小。 |
|
STFT层计算输入的短时傅里叶变换。 |
层 | 描述 |
---|---|
通过将输入划分为1-D池区,然后计算每个区域的平均值来执行1-D平均池化层对下采样。 | |
通过将输入划分为矩形池区域,然后计算每个区域的平均值来执行2-D平均池化层进行下采样。 | |
通过将三维输入划分为立方体池区域,然后计算每个区域的平均值来执行下采样。 | |
一维全局平均池化层通过输出输入的时间或空间维度的平均值来执行向下采样。 | |
二维全局平均池化层通过计算输入的高度和宽度维度的平均值来执行下采样。 | |
三维全局平均池化层通过计算输入的高度、宽度和深度维度的平均值来执行下采样。 | |
通过将输入划分为1-D池区域,然后计算每个区域的最大值,通过将输入分为1-d最大池池层进行下采样。 | |
二维最大池化层通过将输入分割成矩形池化区域,然后计算每个区域的最大值来进行向下采样。 | |
通过将三维输入划分为立方体池区,然后计算每个区域的最大值来执行下采样。 | |
一维全局最大池化层通过输出输入的最大时间或空间维度来执行向下采样。 | |
一个二维全局最大池化层通过计算输入高度和宽度的最大尺寸来执行向下采样。 | |
通过计算输入的高度,宽度和深度尺寸的最大值,3-D全局最大池池层执行下采样。 | |
一个2d最大非池化层将取消池化一个2d最大池化层的输出。 |
层 | 描述 |
---|---|
加法层以元素的方式增加来自多个神经网络层的输入。 | |
乘法层乘以多个神经网络层元素的输入。 | |
深度级联层接受具有相同高度和宽度的输入,并沿第三维(通道维)将它们级联。 | |
级联层采用输入并沿指定的维度连接它们。输入必须具有除倾斜维度之外的所有尺寸中的大小相同。 | |
|
加权加法层按元素扩展并添加来自多个神经网络层的输入。 |
层 | 描述 |
---|---|
|
ROI输入层将图像输入到Fast R-CNN目标检测网络。 |
|
ROI最大池化层为输入特征图中的每个矩形ROI输出固定大小的特征图。使用这一层创建一个快速或更快的R-CNN对象检测网络。 |
|
ROI对齐层输出输入特征图中每个矩形ROI的固定大小特征映射。使用此图层创建掩码R-CNN网络。 |
|
锚盒层存储用于对象检测网络的特征图的锚盒。 |
|
在Faster R-CNN中,区域建议层输出围绕图像中潜在目标的包围框,作为区域建议网络(RPN)的一部分。 |
|
SSD合并图层合并用于后续回归和分类损耗计算的特征映射的输出。 |
![]() YOLOV2TRANSFORMLAYER. (计算机视觉工具箱) |
您只有一个版本2(yolo v2)网络的变换层(yolo v2)网络将网络中最后一个卷积层的边界框预测变换为落入地面真理的范围内。使用变换层提高YOLO V2网络的稳定性。 |
|
空间到深度层将输入的空间块置换为深度维度。当您需要在不丢弃任何特征数据的情况下组合不同大小的特征图时,可以使用此层。 |
|
2-D深度到空间层从深度维度置换到2-D空间数据的块中。 |
|
区域提案网络(RPN)Softmax层将SoftMax激活功能应用于输入。使用这一层创建一个更快的R-CNN对象检测网络。 |
|
焦点丢失层使用焦点丢失预测对象类。 |
|
区域提案网络(RPN)分类层将图像区域分类为对象或者背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 |
|
盒回归层通过使用平滑的L1损失函数来改进包围盒的位置。使用这一层创建一个快速或更快的R-CNN对象检测网络。 |
层 | 描述 |
---|---|
softmax层对输入端应用softmax功能。 | |
S形层将S形函数应用于输入,使得输出在间隔(0,1)中界定。 | |
分类层计算分类和具有互斥类的加权分类任务的交叉熵损失。 | |
回归层计算回归任务的半平均误差损失。 | |
|
像素分类层为每个图像像素或体素提供分类标签。 |
|
骰子像素分类层为每个图像像素或体素使用广义骰子丢失提供分类标签。 |
|
焦点丢失层使用焦点丢失预测对象类。 |
|
区域提案网络(RPN)Softmax层将SoftMax激活功能应用于输入。使用这一层创建一个更快的R-CNN对象检测网络。 |
|
区域提案网络(RPN)分类层将图像区域分类为对象或者背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 |
|
盒回归层通过使用平滑的L1损失函数来改进包围盒的位置。使用这一层创建一个快速或更快的R-CNN对象检测网络。 |
|
您只有一次看一次版本2(YOLO V2)网络通过最小化预测位置与地面真理之间的平均平方误差丢失来改进边界框位置。 |
TVERSKY像素分类层为每个图像像素或voxel提供了一个分类标签,使用TVersky丢失。 | |
|
分类SSE层计算分类问题的平方和误差损失。 |
|
回归MAE层计算回归问题的平均绝对误差损失。 |