GPU编码器™支持序列金宝app和有向无环图(DAG)卷积神经网络(CNNs或ConvNets)的代码生成。您可以为任何训练有素的卷积神经网络生成代码,这些神经网络的层支持代码生成。金宝app看到金宝app支撑层.您可以使用深度学习工具箱™在CPU、GPU或多个GPU上训练卷积神经网络,或使用表中列出的预训练网络之一并生成CUDA®密码
网络名称 | 描述 | cuDNN | 坦索特 | 臂®马里GPU的计算图书馆 |
---|---|---|---|---|
阿列克斯内特 |
AlexNet卷积神经网络。有关预训练的AlexNet模型,请参见 的语法 |
对 |
对 |
对 |
Caffe网络 |
来自Caffe的卷积神经网络模型。有关从Caffe导入预训练网络的信息,请参阅 |
对 |
对 |
对 |
Darknet-19 |
Darknet-19卷积神经网络。有关更多信息,请参见 的语法 |
对 |
对 |
对 |
黑暗-53 |
Darknet-53卷积神经网络。有关更多信息,请参阅 的语法 |
对 |
对 |
对 |
深海实验室v3+ |
DeepLab v3+卷积神经网络。有关更多信息,请参阅 |
对 |
对 |
没有 |
densenet - 201 |
DenseNet-201卷积神经网络。关于预先训练的DenseNet-201模型,请看 的语法 |
对 |
对 |
对 |
效率网-b0 |
efficient -b0卷积神经网络。关于预先训练过的EfficientNet-b0模型,请参见 的语法 |
对 | 对 | 对 |
GoogLeNet |
GoogLeNet卷积神经网络。有关预训练的GoogLeNet模型,请参见 的语法 |
对 |
对 |
对 |
Inception-ResNet-v2 |
Inception-ResNet-v2卷积神经网络。关于预训练的Inception-ResNet-v2模型,请参见 |
对 |
对 |
没有 |
Inception-v3 |
Inception-v3卷积神经网络。关于预训练的Inception-v3模型,请参见 的语法 |
对 |
对 |
对 |
Mobilenet-v2 |
MobileNet-v2卷积神经网络。有关预培训的MobileNet-v2型号,请参阅 的语法 |
对 |
对 |
对 |
NASNet-Large |
大型卷积神经网络。关于预先训练的NASNet-Large模型,请参见 |
对 |
对 |
没有 |
NASNet移动 |
NASNet移动卷积神经网络。有关预训练的NASNet移动模型,请参见 |
对 |
对 |
没有 |
ResNet |
ResNet-18, ResNet-50和ResNet-101卷积神经网络。关于预先训练的ResNet模型,请参见 的语法 |
对 |
对 |
对 |
赛格网 |
多类像素分割网络。有关更多信息,请参见 |
对 |
对 |
没有 |
挤压网 |
小型深度神经网络。对于预先训练过的SqueezeNet模型,请看 的语法 |
对 |
对 |
对 |
VGG-16 |
VGG-16卷积神经网络。对于预先训练的VGG-16模型,请参见 的语法 |
对 |
对 |
对 |
VGG-19 |
VGG-19卷积神经网络。有关预训练VGG-19模型,请参阅 的语法 |
对 |
对 |
对 |
Xception |
异常卷积神经网络。有关预训练的异常模型,请参阅 的语法 |
对 |
对 |
对 |
约洛v2 |
你只看一次基于卷积神经网络的物体检测器。有关更多信息,请参见 |
对 |
对 |
对 |
GPU编码器支持以下层为表中指定的目标深度学习库生金宝app成代码。
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
图像输入层将二维图像输入到网络并应用数据规范化。 不支持代码生成金宝app |
对 |
对 |
对 |
|
序列输入层将序列数据输入到网络。 cuDNN库支持矢量和二维图像序列。金宝appTensorRT库仅支持矢量输入序列。 对于矢量序列输入,在代码生成过程中,特征的数量必须是常数。 对于图像序列输入,在代码生成期间,通道的高度、宽度和数量必须是一个常量。 不支持代码生成金宝app |
对 |
对 |
没有 |
|
特征输入层将特征数据输入到网络,并进行数据规范化。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
二维卷积层将滑动卷积滤波器应用于输入。 |
对 |
对 |
对 |
|
一个完全连接的层将输入乘以一个权重矩阵,然后添加一个偏置向量。 |
对 |
对 |
没有 |
|
二维分组卷积层将输入通道分成若干组并应用滑动卷积滤波器。使用分组卷积层进行通道可分离(也称为深度可分离)卷积。 具有以下特性的二维分组卷积层不支持ARM-GPU的代码生成:金宝app |
对 |
对 |
对 |
|
转置的二维卷积层对特征地图进行上采样。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
双向LSTM (BiLSTM)层学习时间序列或序列数据的时间步长之间的双向长期依赖关系。当您希望网络在每个时间步骤中从完整的时间序列中学习时,这些依赖项可能会很有用。 对于代码生成 对于代码生成 |
对 |
对 |
没有 |
|
扁平层将输入的空间维度折叠为通道维度。 |
对 |
没有 |
没有 |
|
GRU层学习时间序列和序列数据中时间步之间的依赖关系。 代码生成只支持金宝app |
对 |
对 |
没有 |
|
LSTM层学习时间序列和序列数据中时间步长之间的长期依赖关系。 对于代码生成 对于代码生成 |
对 |
对 |
没有 |
|
序列折叠层将一批图像序列转换为一批图像。使用序列折叠层对图像序列的时间步独立进行卷积运算。 |
对 |
没有 |
没有 |
|
序列输入层将序列数据输入到网络。 cuDNN库支持矢量和二维图像序列。金宝appTensorRT库仅支持矢量输入序列。 对于矢量序列输入,在代码生成过程中,特征的数量必须是常数。 对于图像序列输入,在代码生成期间,通道的高度、宽度和数量必须是一个常量。 不支持代码生成金宝app |
对 |
对 |
没有 |
|
序列展开层还原输入数据在序列折叠后的序列结构。 |
对 |
没有 |
没有 |
|
单词嵌入层将单词索引映射到向量。 |
对 |
对 |
没有 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
被裁剪的ReLU层执行一个阈值操作,其中任何小于0的输入值都被设置为0,任何高于剪裁天花板被设置在了天花板上。 |
对 |
对 |
对 |
|
ELU激活层对正输入执行恒等式运算,对负输入执行指数非线性运算。 |
对 |
对 |
没有 |
|
一个泄漏的ReLU层执行一个阈值操作,其中任何小于零的输入值乘以一个固定标量。 |
对 |
对 |
对 |
|
ReLU层对输入的每个元素执行一个阈值操作,其中任何小于零的值都被设置为零。 |
对 |
对 |
对 |
|
一个 |
对 |
对 |
没有 |
|
双曲正切(tanh)激活层将tanh函数应用于层输入。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
批处理规范化层通过一个小批处理规范化每个输入通道。 |
对 |
对 |
对 |
|
二维裁剪层将二维裁剪应用于输入。 |
对 |
对 |
对 |
|
信道本地响应(跨信道)归一化层执行信道归一化。 |
对 |
对 |
对 |
|
退出层以给定的概率将输入元素随机设置为零。 |
对 |
对 |
对 |
|
演员或评论家网络的缩放层。 的值用于代码生成 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
平均池化层通过将输入划分为矩形池化区域并计算每个区域的平均值来执行向下采样。 |
对 |
对 |
对 |
|
全局平均池层通过计算输入的高度和宽度维度的平均值来执行下采样。 |
对 |
对 |
对 |
|
全局最大池化层通过计算输入的最大高度和宽度维度来执行向下采样。 |
对 |
对 |
对 |
|
最大池化层通过将输入划分为矩形池化区域,并计算每个区域的最大值来进行向下采样。 |
对 |
对 |
对 |
|
最大取消冷却层取消冷却最大池层的输出。 |
对 |
对 |
没有 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
加法层以元素的方式增加来自多个神经网络层的输入。 |
对 |
对 |
对 |
|
连接层接受输入并沿指定的维度连接它们。 |
对 |
对 |
没有 |
|
深度级联层接受具有相同高度和宽度的输入,并沿第三维(通道维)将它们级联。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
锚定框层存储用于对象检测网络的特征地图的锚定框。 |
对 |
对 |
对 |
|
焦点损失层使用焦点损失预测对象类。 | 对 |
对 |
对 |
|
空间到深度层将输入的空间块置换为深度维度。当您需要在不丢弃任何特征数据的情况下组合不同大小的特征图时,可以使用此层。 | 对 |
对 |
对 |
|
SSD合并层将特征图的输出进行合并,用于后续的回归和分类损失计算。 |
对 |
对 |
没有 |
|
盒回归层通过使用平滑的L1损失函数来改进包围盒的位置。使用这一层创建一个快速或更快的R-CNN对象检测网络。 | 对 |
对 |
对 |
|
区域建议网络(RPN)分类层将图像区域分类为对象或背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 | 对 |
对 |
对 |
|
为YOLO v2对象检测网络创建输出层。 |
对 |
对 |
对 |
|
为YOLO v2对象检测网络创建重组层。 |
对 |
对 |
对 |
|
为YOLO v2对象检测网络创建变换层。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
分类层计算具有互斥类的多类分类问题的交叉熵损失。 |
对 |
对 |
对 |
|
Dice像素分类层使用广义Dice损失为每个图像像素或体素提供分类标签。 |
对 |
对 |
对 |
|
焦点损失层使用焦点损失预测对象类。 | 对 |
对 |
对 |
|
使用创建的所有输出层,包括自定义分类或回归输出层 有关显示如何定义自定义分类输出图层和指定损失函数的示例,请参见定义自定义分类输出层(深度学习工具箱). 有关显示如何定义自定义回归输出层和指定损失函数的示例,请参见定义自定义回归输出层(深度学习工具箱). |
对 |
对 |
对 |
|
像素分类层为每个图像像素或体素提供分类标签。 |
对 |
对 |
对 |
|
盒回归层通过使用平滑的L1损失函数来改进包围盒的位置。使用这一层创建一个快速或更快的R-CNN对象检测网络。 | 对 |
对 |
对 |
|
回归层计算回归问题的半均方误差损失。 |
对 |
对 |
对 |
|
区域建议网络(RPN)分类层将图像区域分类为对象或背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 | 对 |
对 |
对 |
|
sigmoid层将sigmoid函数应用于输入。 |
对 |
对 |
对 |
|
softmax层对输入端应用softmax功能。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
假设c风格(行为主)顺序,将激活压成一维。 |
对 |
对 |
对 |
|
空间数据的全局平均池层。 |
对 |
对 |
对 |
|
乙状激活层。 |
对 |
对 |
对 |
|
双曲正切活化层。 |
对 |
对 |
对 |
|
用于二维输入的零填充层。 |
对 |
对 |
对 |
|
层,对输入执行按元素缩放,然后添加。 |
对 |
对 |
对 |
|
将输入张量的空间维度展平为通道维度。 |
对 |
对 |
对 |
|
实现ONNX标识运算符的层。 |
对 |
对 |
对 |
层的名字 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
|
自定义层,有或没有可学习的参数,您为您的问题定义。 要了解如何定义自定义深度学习层,请参见定义自定义深度学习层(深度学习工具箱)和定义用于代码生成的自定义深度学习层(深度学习工具箱). 有关如何为具有自定义层的网络生成代码的示例,请参见使用YOLO v3深度学习的目标检测代码生成. 自定义图层的输出必须是固定大小的数组。 使用 cuDNN目标支持为自定义层金宝app生成行主代码和列主代码。TensorRT目标仅支持列主代码生成。 对于代码生成,自定义层必须包含 不支持包含自定义层和LSTM或GRU层的序列网络的代码生成。金宝app 在Simulink中不支持基于自定义层的深度学习网络的代码生成金宝app金宝app®. |
对 |
对 |
没有 |
GPU编码器支持以下类为表中指定的目标深度学习库生成金宝app代码。
名称 | 描述 | cuDNN | 坦索特 | 马里GPU的ARM计算库 |
---|---|---|---|---|
DAGNetwork (深度学习工具箱) |
用于深度学习的有向无环图(DAG)网络
|
对 |
对 |
对 |
数据链路网络 (深度学习工具箱) |
深度学习网络自定义训练循环
|
对 |
对 |
没有 |
SeriesNetwork (深度学习工具箱) |
深度学习系列网络
|
对 |
对 |
对 |
ssdObjectDetector (计算机视觉工具箱) |
对象使用基于ssd的检测器检测对象。
|
对 |
对 |
没有 |
yolov2ObjectDetector (计算机视觉工具箱) |
使用YOLO v2对象检测器检测对象
|
对 |
对 |
对 |
编码器。CodeConfig
|coder.CuDNNConfig
|coder.EmbeddedCodeConfig
|coder.gpuConfig
|coder.gpuEnvConfig
|编码器。TensorRTConfig