这个示例演示了如何从DAGNetwork对象生成CUDA®代码,并使用NVIDIA GPU编码器™支持包将生成的代码部署到NVIDIA®Jetson®TX2板上。金宝app本例使用resnet50深度学习网络对USB网络摄像头视频流中的图像进行分类。
目标板需求
NVIDIA Jetson Tegra TX2嵌入式平台。
用于连接目标板和主机PC(如果目标板无法连接本地网络)的以太网交叉线缆。
USB摄像头连接TX2。
目标板上安装了NVIDIA CUDA工具包。
目标板上的NVIDIA cuDNN库。
OpenCV库上的目标,用于读取和显示图像/视频。
目标上的编译器和库的环境变量。有关编译器和库的支持版本及其设置的信息,请参见金宝appNVIDIA主板的安装和设置必备事项(NVIDIA Jetson金宝app和NVIDIA DRIVE平台的MATLAB编码器支持包)NVIDIA的董事会。
开发主机需求
NVIDIA CUDA工具包和驱动程序。
编译器和库的环境变量。有关编译器和库支持的版本的信息,请参见金宝app第三方硬件.有关设置环境变量,请参见设置前提产品下载188bet金宝搏.
使用检查硬件支持包安装金宝app
命令,以验证主机系统是否兼容运行此示例。
checkHardware金宝appSupportPackageInstall ();
NVIDIA GPU的GPU金宝app编码器支持包通过TCP/IP使用SSH连接来执行命令,同时在Jetson平台上构建和运行生成的CUDA代码。因此,需要将目标平台与主机连接到同一网络,或者使用以太网交叉网线直接将单板与主机连接。请参考NVIDIA的文档,了解如何设置和配置您的主板。
要与NVIDIA硬件通信,必须使用杰森
(NVIDIA Jetson金宝app和NVIDIA DRIVE平台的MATLAB编码器支持包)作用要创建实时硬件连接对象,必须知道目标板的主机名或IP地址、用户名和密码。
hwobj =杰森(“主机”,“用户名”,“密码”);
如果连接失败,会在MATLAB命令行上报告诊断错误消息。如果连接失败,最有可能的原因是错误的IP地址或主机名。
当针对不同目标存在多个活动连接对象时,代码生成器将在为其创建最近活动对象的目标上执行远程构建。要选择执行远程构建的硬件板,请使用setupCodegenContext ()
方法。如果只创建了一个活动连接对象,则没有必要调用此方法。
hwobj.setupCodegenContext;
使用coder.checkGpuInstall
函数来验证运行此示例所需的编译器和库是否正确设置。
envCfg = coder.gpuEnvConfig (“杰森”);envCfg。DeepLibTarget =“cudnn”;envCfg。DeepCodegen = 1;envCfg。安静= 1;envCfg。HardwareObject = hwobj;coder.checkGpuInstall (envCfg);
的resnet50_包装器.m
入口点函数使用预先训练的ResNet-50网络对图像进行分类。ResNet-50是一个DAG网络,训练了来自ImageNet数据库的100多万张图像。输出包含图像所属的每个类的分类分数。
类型resnet50_wrapper
函数out=resnet50_wrapper(im,ocvFlag)%#codegen%wrapper函数调用resnet50预测函数版权2019-2021 MathWorks,Inc.%此示例使用OpenCV从网络摄像机读取帧并%显示输出图像。更新buildinfo以链接目标上可用的OpenCV库%。如果ocvFlag opencv_link_flags=`pkg config--libs opencv4`;opencv_compile_flags='`pkg config--cflags opencv4`';else opencv_link_flags=`pkg config--libs opencv`;opencv_compile_flags='`pkg config--cflags--libs opencv`';end coder.updateBuildInfo('addLinkFlags',opencv_link_flags');coder.updateBuildInfo('addCompileFlags',opencv_compile_标志);%为了避免每次运行的多个网络负载,我们使用persistent%rnet persistent-rnet;如果为空(rnet),则rnet=resnet50();结束输出=rnet.predict(im);终止
使用pkg-config
帮助工具查询是否OpenCV 4。X安装在目标板上。本例使用该信息来更新构建信息,以链接到目标上可用的适当OpenCV库。
等密度V4=1;ocvVersion=hwobj.OpenCVVersion();如果(str2double(ocvVersion(1)) <= 3) isOpenCV4 = 0;结束
要生成可部署到NVIDIA目标上的CUDA可执行文件,创建一个GPU编码器配置对象来生成可执行文件。
cfg = coder.gpuConfig (exe”);
使用coder.hardware
函数创建用于Jetson平台的配置对象,并将其分配给硬件
图形处理器代码配置对象的属性cfg
.
cfg。硬件= coder.hardware (英伟达杰森的);
设置深度学习配置为“cudnn”或“tensort”
cfg。DeepLearningConfig =编码器。DeepLearningConfig (“cudnn”);
在本例中,代码生成使用图像作为输入。然而,网络摄像头流在部署后被提供一个输入给可执行文件。
用于代码生成的示例图像输入
我=单(imread (“peppers.png”)); im=imresize(im[224224]);
自定义主文件被编码为将视频作为输入,并对视频序列中的每一帧进行分类。自定义main_resnet50.cu
File是在生成的代码中调用predict函数的包装器。后期处理步骤,如在输入框上显示输出,使用OpenCV接口添加到主文件中。
cfg。CustomSource = fullfile (“main_resnet50.h”);cfg。CustomSource = fullfile (“main_resnet50.cu”);
要生成CUDA代码并将其部署到目标,请使用codegen
函数,并传递GPU代码配置对象。在主机上进行代码生成之后,将复制生成的文件并在工作区目录中的目标上构建。
codegen配置cfgarg游戏{im, coder.Constant (isOpenCV4)}resnet50_wrapper报告
属性将synsetWords_resnet50文本文件从主机复制到目标设备putFile
命令。
putFile (hwobj“synsetWords_resnet50.txt”, hwobj.workspaceDir);
使用runApplication
方法来在目标硬件上启动应用程序。应用程序将位于工作区目录中。
runApplication (hwobj“resnet50_wrapper”);
如果网络摄像头窗口在目标板上不可见,它可能被指向不正确的显示。使用setDisplayEnvironment
命令功能设置用于在目标上重定向显示的显示环境。该值必须与$DISPLAY
单板上设置的环境值。
使用killApplication
方法来杀死目标上正在运行的应用程序。
killApplication (hwobj“resnet50_wrapper”);
杰森
(NVIDIA Jetson金宝app和NVIDIA DRIVE平台的MATLAB编码器支持包)|开车
(NVIDIA Jetson金宝app和NVIDIA DRIVE平台的MATLAB编码器支持包)