主要内容

Coder.TensorRTConfig

参数来配置深度学习代码生成英伟达TensorRT图书馆

描述

Coder.TensorRTConfig对象包含了英伟达®高性能深度学习推理优化器和运行时库(TensorRT)特定参数。codegen使用这些参数生成CUDA®深度神经网络代码。

使用一个Coder.TensorRTConfig对象,将其分配给DeepLearningConfig财产的coder.gpuConfig对象codegen

创建

属性创建TensorRT配置对象coder.deeplearningconfig函数的目标库设置为“tensorrt”

属性

全部展开

指定支持层中推理计算的精度。金宝app在32位浮点数中执行推理时,使用“fp32”.对于half-precision,使用'fp16'.对于8位整数,使用'int8'.默认值是“fp32”

INT8精度要求CUDA GPU最小计算能力为6.1。不支持6.2的计算能力金宝appINT8精度。FP16精度要求CUDA GPU的最低计算能力7.0。使用ComputeCapability财产的财产gpuconfig对象设置适当的计算能力值。

看看使用NVIDIA Tensorrt深入学习预测例如,使用TensorRT进行标识分类网络的8位整数预测。

在重新校准期间使用的图像数据集的位置。默认值是''.此选项仅适用于以下情况数据类型被设定为'int8'

当你选择“INT8”选项,TensorRT™将浮点数据量化为int8.用减少的校准数据集进行重新校准。校准数据必须出现在指定的图像数据位置DataPath公司

指定要处理的批数的数值int8校准。该软件使用的产品batchsize * NumCalibrationBatches从图像数据集中随机选取图像子集进行校准。的batchsize * NumCalibrationBatches值不能大于图像数据集中存在的图像数量。此选项仅适用于以下情况数据类型被设定为'int8'

NVIDIA建议大约500张图片就足够进行校准了。有关更多信息,请参阅TensorRT文档。

一个只读值,指定目标库的名称。

例子

全部折叠

创建一个入口点函数resnet_predict使用coder.loadDeepLearningNetwork装载的功能resnet50(深度学习工具箱)SeriesNetwork目的。

功能OUT = RESNET_PREDICT(IN)持续的mynet;如果isempty(mynet)mynet = coder.loaddeeplearningnetwork(“resnet50”“myresnet”);结束=预测(mynet,);

创建一个coder.gpuConfig配置对象,用于生成MEX代码。

cfg = coder.gpuConfig (墨西哥人的);

将目标语言设置为c++。

cfg.targetlang =.“c++”

创建一个Coder.TensorRTConfig深度学习配置对象。把它赋给DeepLearningConfig财产的财产cfg配置对象。

cfg。DeepLearningConfig =编码器。DeepLearningConfig (“tensorrt”);

使用配置选择的codegen函数传递cfg配置对象。的codegen功能必须确定matlab的大小,类和复杂性®功能输入。使用arg游戏选项指定入口点函数的输入大小。

codegenarg游戏{(224224 3,“单”)}配置cfgresnet_predict

codegen命令将所有生成的文件放入codegen文件夹中。该文件夹包含入口点函数的CUDA代码resnet_predict.cu,包含Contruted神经网络(CNN),重量和偏置文件的C ++类定义的标题和源文件。

介绍了R2018b