GPU编码器™支持序列金宝app和有向无环图(DAG)卷积神经网络(CNNs或ConvNets)的代码生成。您可以为任何训练有素的卷积神经网络生成代码,这些神经网络的层支持代码生成。金宝app看到金宝app支持的层数.您可以使用深度学习工具箱™在CPU、GPU或多个GPU上训练卷积神经网络,或使用表中列出的预训练网络之一并生成CUDA®代码。
网络名称 | 描述 | CUDNN. | 张力 | 手臂®马里GPU的计算图书馆 |
---|---|---|---|---|
AlexNet. |
亚历克网卷积神经网络。对于预折叠的AlexNet模型,请参阅 的语法 |
是的 |
是的 |
是的 |
Caffe Network. |
Caffe的卷积神经网络模型。要从Caffe导入预先训练过的网络,请参见 |
是的 |
是的 |
是的 |
Darknet-19. |
Darknet-19卷积神经网络。有关更多信息,请参见 的语法 |
是的 |
是的 |
是的 |
Darknet-53. |
Darknet-53卷积神经网络。有关更多信息,请参阅 的语法 |
是的 |
是的 |
是的 |
deebplab v3 + |
DEEPLAB V3 +卷积神经网络。有关更多信息,请参见 |
是的 |
是的 |
不 |
densenet - 201 |
DenseNet-201卷积神经网络。关于预先训练的DenseNet-201模型,请看 的语法 |
是的 |
是的 |
是的 |
EfficientNet-b0 |
efficient -b0卷积神经网络。关于预先训练过的EfficientNet-b0模型,请参见 的语法 |
是的 | 是的 | 是的 |
googlenet. |
Googlenet卷积神经网络。对于预磨损的googlenet模型,请参阅 的语法 |
是的 |
是的 |
是的 |
Inception-Resnet-V2 |
Inception-Reset-V2卷积神经网络。对于预磨削的Inception-Resnet-V2型号,请参阅 |
是的 |
是的 |
不 |
Inception-V3. |
Inception-V3卷积神经网络。对于预磨削的Inception-V3模型,请参阅 的语法 |
是的 |
是的 |
是的 |
Mobilenet-v2 |
v2卷积神经网络。关于预先训练过的MobileNet-v2模型,请参见 的语法 |
是的 |
是的 |
是的 |
nasnet-light. |
NASNet-大型卷积神经网络。对于普里雷雷达的NASNet - 大型模型,见 |
是的 |
是的 |
不 |
NASNet-Mobile |
NASNET-MOBILE卷积神经网络。对于预磨损的NASNet-Mobile Model,请参阅 |
是的 |
是的 |
不 |
reset. |
Resnet-18,Resnet-50和Reset-101卷积神经网络。对于预用的resnet模型,请参阅 的语法 |
是的 |
是的 |
是的 |
SEGNET. |
多级PixelWise分段网络。有关更多信息,请参见 |
是的 |
是的 |
不 |
挤压 |
小深神经网络。对于预先磨碎的挤压型模型,请参阅 的语法 |
是的 |
是的 |
是的 |
vgg-16. |
VGG-16卷积神经网络。对于普雷克vgg-16型号,看 的语法 |
是的 |
是的 |
是的 |
vgg-19. |
VGG-19卷积神经网络。对于普雷克vgg-19型号,看 的语法 |
是的 |
是的 |
是的 |
Xception |
卷积神经网络除外。关于预先训练的exception模型,请参见 的语法 |
是的 |
是的 |
是的 |
YOLO v2意思 |
您只能看一次版本2卷积神经网络的对象检测器。有关更多信息,请参见 |
是的 |
是的 |
是的 |
对于表中指定的目标深度学习库,GPU Coder支金宝app持以下层进行代码生成。
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
图像输入层将2-D图像输入到网络并应用数据归一化。 代码生成不支持金宝app |
是的 |
是的 |
是的 |
|
序列输入层将序列数据输入到网络。 CUDNN库支持向量和2-D图像序列金宝app。TensorR库仅支持载体输入序列。金宝app 对于向量序列输入,在代码生成期间必须是常数的特征数量。 对于图像序列输入,高度,宽度和通道数量在代码生成期间必须是常数。 代码生成不支持金宝app |
是的 |
是的 |
不 |
|
特征输入层将特征数据输入到网络,并进行数据规范化。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
二维卷积层将滑动卷积滤波器应用于输入。 |
是的 |
是的 |
是的 |
|
一个完全连通的层将输入乘以一个权值矩阵,然后添加一个偏置向量。 |
是的 |
是的 |
不 |
|
一个二维分组卷积层将输入通道分成组,并应用滑动卷积滤波器。使用分组卷积层进行信道可分(也称为深度可分)卷积。 ARM Mali GPU的代码生成不支持2-D分组卷积层金宝app |
是的 |
是的 |
是的 |
|
转置的2-D卷积层Upsamples特征图。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
双向LSTM (BiLSTM)层学习时间序列或序列数据的时间步长之间的双向长期依赖关系。当您希望网络在每个时间步骤中从完整的时间序列中学习时,这些依赖项可能会很有用。 对于代码生成, 对于代码生成, |
是的 |
是的 |
不 |
|
扁平层将输入的空间尺寸塌陷到通道尺寸中。 |
是的 |
不 |
不 |
|
GRU层学习时间序列和序列数据的时间步骤之间的依赖性。 代码生成仅支持金宝app |
是的 |
是的 |
不 |
|
LSTM层在时间序列和序列数据中的时间步骤之间学习长期依赖性。 对于代码生成, 对于代码生成, |
是的 |
是的 |
不 |
|
序列折叠层将一批图像序列转换为一批图像。使用序列折叠层独立于图像序列的时间步骤执行卷积操作。 |
是的 |
不 |
不 |
|
序列输入层将序列数据输入到网络。 CUDNN库支持向量和2-D图像序列金宝app。TensorR库仅支持载体输入序列。金宝app 对于向量序列输入,在代码生成期间必须是常数的特征数量。 对于图像序列输入,高度,宽度和通道数量在代码生成期间必须是常数。 代码生成不支持金宝app |
是的 |
是的 |
不 |
|
序列展开层恢复序列折叠后输入数据的序列结构。 |
是的 |
不 |
不 |
|
嵌入层映射到向量中的Word Indices。 |
是的 |
是的 |
不 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
剪切的Relu层执行阈值操作,其中小于零的任何输入值被设置为零,并且在上方的任何值剪裁天花板被设置在了天花板上。 |
是的 |
是的 |
是的 |
|
ELU激活层对负输入上的正输入和指数非线性执行身份操作。 |
是的 |
是的 |
不 |
|
一个泄漏的ReLU层执行一个阈值操作,其中任何小于零的输入值乘以一个固定标量。 |
是的 |
是的 |
是的 |
|
ReLU层对输入的每个元素执行一个阈值操作,其中任何小于零的值都被设置为零。 |
是的 |
是的 |
是的 |
|
一个 |
是的 |
是的 |
不 |
|
双曲正切(tanh)激活层将tanh函数应用于层输入。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
批量归一化层将跨越批次的每个输入通道标准化。 |
是的 |
是的 |
是的 |
|
2-D作物层应用2-D裁剪输入。 |
是的 |
是的 |
是的 |
|
频道明智的本地响应(跨通道)归一化层执行通道明智的归一化。 |
是的 |
是的 |
是的 |
|
丢弃层随机将输入元素随机设置为零,具有给定的概率。 |
是的 |
是的 |
是的 |
|
演员或评论家网络的缩放层。 的值用于代码生成 |
是的 |
是的 |
是的 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
平均池化层通过将输入划分为矩形池化区域并计算每个区域的平均值来执行向下采样。 |
是的 |
是的 |
是的 |
|
全局平均池化层通过计算输入的高度和宽度尺寸的平均值来执行缩小采样。 |
是的 |
是的 |
是的 |
|
全局最大池层通过计算输入的高度和宽度尺寸的最大值来执行缩小采样。 |
是的 |
是的 |
是的 |
|
最大池化层通过将输入划分为矩形池化区域,并计算每个区域的最大值来进行向下采样。 |
是的 |
是的 |
是的 |
|
最大非池化层取消池化最大池化层的输出。 |
是的 |
是的 |
不 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
加法层以元素的方式增加来自多个神经网络层的输入。 |
是的 |
是的 |
是的 |
|
级联层采用输入并沿指定的维度连接它们。 |
是的 |
是的 |
不 |
|
深度级联层采用具有相同高度和宽度的输入,并沿着第三尺寸(通道维度)连接它们。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
锚箱层存储用于物体检测网络中使用的特征映射的锚盒。 |
是的 |
是的 |
是的 |
|
焦点丢失层使用焦点丢失预测对象类。 | 是的 |
是的 |
是的 |
|
空间到深度层将输入的空间块置换为深度维度。当您需要在不丢弃任何特征数据的情况下组合不同大小的特征图时,可以使用此层。 | 是的 |
是的 |
是的 |
|
SSD合并图层合并用于后续回归和分类损耗计算的特征映射的输出。 |
是的 |
是的 |
不 |
|
通过使用平滑的L1损耗功能,盒回归层炼制边界框位置。使用此图层创建快速或更快的R-CNN对象检测网络。 | 是的 |
是的 |
是的 |
|
区域提案网络(RPN)分类层将图像区域分类为对象要么背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 | 是的 |
是的 |
是的 |
|
为Yolo V2对象检测网络创建输出层。 |
是的 |
是的 |
是的 |
|
为YOLO V2对象检测网络创建重组层。 |
是的 |
是的 |
是的 |
|
为YOLO v2对象检测网络创建变换层。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
分类层计算互斥类的多级分类问题的跨熵损失。 |
是的 |
是的 |
是的 |
|
骰子像素分类层为每个图像像素或体素使用广义骰子丢失提供分类标签。 |
是的 |
是的 |
是的 |
|
焦点丢失层使用焦点丢失预测对象类。 | 是的 |
是的 |
是的 |
|
所有输出图层都包括使用自定义分类或回归输出图层 有关如何定义自定义分类输出层和指定损失函数的示例,请参见定义自定义分类输出层(深度学习工具箱). 有关如何定义自定义回归输出层和指定损失函数的示例,请参见定义自定义回归输出层(深度学习工具箱). |
是的 |
是的 |
是的 |
|
像素分类层为每个图像像素或体素提供分类标签。 |
是的 |
是的 |
是的 |
|
通过使用平滑的L1损耗功能,盒回归层炼制边界框位置。使用此图层创建快速或更快的R-CNN对象检测网络。 | 是的 |
是的 |
是的 |
|
回归层计算回归问题的半均方误差损失。 |
是的 |
是的 |
是的 |
|
区域提案网络(RPN)分类层将图像区域分类为对象要么背景通过交叉熵损失函数。使用这一层创建一个更快的R-CNN对象检测网络。 | 是的 |
是的 |
是的 |
|
s型层将s型函数应用于输入。 |
是的 |
是的 |
是的 |
|
Softmax层将SoftMax函数应用于输入。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
假设C-Siqul(Row-Major)订单,将激活变为1-D。 |
是的 |
是的 |
是的 |
|
用于空间数据的全局平均池化层。 |
是的 |
是的 |
是的 |
|
乙状体激活层。 |
是的 |
是的 |
是的 |
|
双曲线切线激活层。 |
是的 |
是的 |
是的 |
|
用于二维输入的零填充层。 |
是的 |
是的 |
是的 |
|
层,对输入执行按元素缩放,然后添加。 |
是的 |
是的 |
是的 |
|
将输入张量的空间尺寸达到通道尺寸。 |
是的 |
是的 |
是的 |
|
实现ONNX身份运算符的图层。 |
是的 |
是的 |
是的 |
层的名字 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
|
自定义层,有或没有可学习的参数,您为您的问题定义。 要了解如何定义自定义深度学习层,请参见定义自定义深度学习层(深度学习工具箱)和定义代码生成的自定义深度学习层(深度学习工具箱). 有关如何生成具有自定义图层的网络代码的示例,请参阅使用YOLO V3深度学习的对象检测的代码. 自定义层的输出必须是固定大小的数组。 使用 CUDNN Targets支金宝app持自定义图层的行主要和列主要代码。Tensorr Targets仅支金宝app持列主要代码生成。 对于代码生成,自定义层必须包含 不支持包含自定义层和LSTM或GRU层的序列网络的代码生成。金宝app 在Simulink中不支持基于自定义层的深度学习网络的代码生成金宝app金宝app®. |
是的 |
是的 |
不 |
对于表中指定的目标深度学习库,GPU Coder支持金宝app以下类生成代码。
名称 | 描述 | CUDNN. | 张力 | ARM计算Mali GPU的库 |
---|---|---|---|---|
Dagnetwork. (深度学习工具箱) |
针对深度学习的针对非循环图(DAG)网络
|
是的 |
是的 |
是的 |
dlnetwork. (深度学习工具箱) |
深度学习网络自定义训练循环
|
是的 |
是的 |
不 |
SeriesNetwork (深度学习工具箱) |
系列网络深度学习
|
是的 |
是的 |
是的 |
ssdObjectDetector (计算机视觉工具箱) |
对象使用基于ssd的检测器检测对象。
|
是的 |
是的 |
不 |
yolov2ObjectDetector (计算机视觉工具箱) |
使用YOLO v2对象检测器检测对象
|
是的 |
是的 |
是的 |
coder.codeConfig
|编码器。CuDNNConfig
|Coder.embeddedCodeConfig
|Coder.gpuconfig.
|coder.gpuenvconfig.
|Coder.TensorRTConfig