深度学习中的数据布局考虑- MATLAB和Simulink金宝app - 金宝app,下载188bet金宝搏,金宝搏官方网站

文档帮助中心文档

深度学习中的数据布局考虑

当您构建使用生成的CUDA的应用程序时^®c++代码，你必须提供一个CUDA c++主函数来调用生成的代码。默认情况下，对于源代码、静态库、动态库和可执行文件的代码生成，使用codegen命令，GPU编码器™生成示例CUDA c++主文件(main.cu源文件和main.h文件中的头文件例子构建文件夹的子文件夹)。这个示例主文件是一个模板，可以帮助您将生成的CUDA代码合并到应用程序中。示例main函数声明和初始化数据，包括动态分配的数据。它调用入口点函数，但不使用入口点函数返回的值。

在为深度卷积神经网络(CNN)生成代码时，代码生成器利用了NVIDIA^®cuDNN, TensorRT用于NVIDIA gpu或ARM^®ARM马里图形处理器的计算库。这些库对保存图像、视频和任何其他数据的输入张量有特定的数据布局要求。在编写用于构建应用程序的自定义主函数时，必须创建输入缓冲区，以这些库所期望的格式向生成的入口点函数提供数据。

CNN的数据布局格式

对于深度卷积神经网络(CNN)，使用一个4-D张量描述符来定义具有以下字母的批量2-D图像的格式:

N-批量大小
C功能地图的数量(通道的数量)
H——高度
W——宽度

显示了最常用的4-D张量格式，其中字母按步长递减顺序排序。

NCHW
NHWC
CHWN

其中，GPU编码器使用NCHW格式(默认为列-主布局)。要使用行主布局，请传递-rowmajor可以选择的codegen命令。或者，通过修改cfg。RowMajor参数在代码生成配置对象中。

例如，考虑一组具有以下维度的图像:N = 1，C = 3，H = 5，W = 4．如果图像像素元素由一个整数序列表示，则输入图像可表示为:

当在主函数中创建输入缓冲区时，4-D图像被放置在存储器中NCHW格式为:

从第一通道开始(C = 0)，这些元素按行长顺序连续排列。
继续使用第二个和以后的通道，直到所有通道的元素都被布置出来。
继续下一批(如果N > 1)．

LSTM的数据布局格式

长短期记忆网络(LSTM)是一种递归神经网络(RNN)，它可以学习序列数据时间步长之间的长期依赖关系。对于LSTM，数据布局格式可以用以下字母表示:

N-批量大小
年代-序列长度(时间步长)
d-一个输入序列的单元数

对于LSTM, GPU编码器使用SNd默认格式。

另请参阅

功能

coder.getDeepLearningLayers|codegen|编码器。DeepLearningConfig

对象

coder.gpuConfig|编码器。CodeConfig|编码器。EmbeddedCodeConfig|coder.gpuEnvConfig|编码器。CuDNNConfig|编码器。TensorRTConfig

相关的话题

GPU编码器文档

金宝app

从MATLAB生成CUDA代码:gpu上加速嵌入式视觉和深度学习算法

从MATLAB生成CUDA代码:gpu上加速嵌入式视觉和深度学习算法

下载白皮书