使用YOLO v2进行目标检测的代码生成
这个例子展示了如何为你只看一次(YOLO) v2对象检测器生成CUDA®MEX。YOLO v2目标检测网络由两个子网络组成。特征提取网络,然后是检测网络。中训练的网络生成代码使用YOLO v2深度学习的目标检测示例来自计算机视觉工具箱™。有关更多信息,请参见使用YOLO v2深度学习的目标检测.中导入的网络可以修改此示例以生成CUDA®MEX导入预训练的ONNX YOLO v2对象检测器示例来自计算机视觉工具箱™。有关更多信息,请参见导入预训练的ONNX YOLO v2对象检测器.
第三方的先决条件
要求
本例生成CUDA MEX,第三方需求如下。
CUDA®启用NVIDIA®GPU和兼容驱动程序。
可选
对于非mex构建,例如静态、动态库或可执行文件,此示例具有以下附加要求。
英伟达工具包。
NVIDIA cuDNN库。
编译器和库的环境变量。有关更多信息,请参见第三方硬件(GPU编码器)而且设置必备产品下载188bet金宝搏(GPU编码器).
检查GPU环境
使用coder.checkGpuInstall
(GPU编码器)函数验证运行此示例所需的编译器和库是否正确设置。
envCfg = code . gpuenvconfig (“主机”);envCfg。DeepLibTarget =“cudnn”;envCfg。DeepCodegen = 1;envCfg。安静= 1;coder.checkGpuInstall (envCfg);
预训练DAGNetwork
本例使用yolov2ResNet50VehicleExample
包含预训练网络的mat文件。该文件大小约为98MB。从MathWorks网站下载该文件。
matFile = matlab.internal.examples.download金宝appSupportFile(“视觉/数据”,“yolov2ResNet50VehicleExample.mat”);vehicleDetector = load(matFile);net = vehicledetector .detect . network
net = DAGNetwork with properties: Layers: [150×1 nnet.cnn.layer.Layer] Connections: [162×2 table] InputNames: {'input_1'} OutputNames: {'yolov2OutputLayer'}
DAG网络包含150层,包括卷积层、ReLU层和批处理归一化层以及YOLO v2转换层和YOLO v2输出层。要显示深度学习网络体系结构的交互式可视化,请使用analyzeNetwork
(深度学习工具箱)函数。
analyzeNetwork(净);
的yolov2_detect
入口点函数
的yolov2_detect.m
入口点函数接受图像输入,并使用保存在中的深度学习网络在图像上运行检测器yolov2ResNet50VehicleExample.mat
文件。方法加载网络对象yolov2ResNet50VehicleExample.mat
文件转换为持久变量yolov2Obj并在后续的检测调用中重用持久对象。
类型(“yolov2_detect.m”)
版权所有2018-2021 The MathWorks, Inc. persistent yolov2Obj;if isempty(yolov2Obj) yolov2Obj = code . loaddeeplearningnetwork (matFile);调用检测方法[bboxes,~,labels] = yolov2Obj.detect(in,'Threshold',0.5);将类别标签转换为单元格数组的字符向量标签= cellstr(标签);注释图像中的检测。outImg = insertObjectAnnotation(在,'矩形',盒子,标签);
运行MEX代码生成
要为入口点函数生成CUDA代码,需要为MEX目标创建GPU代码配置对象,并将目标语言设置为c++。使用编码器。DeepLearningConfig
(GPU编码器)函数创建CuDNN
深度学习配置对象,并将其分配给DeepLearningConfig
GPU代码配置对象的属性。运行codegen
命令指定输入大小为224 × 224 × 3。这个值对应YOLOv2的输入层大小。
cfg = code . gpuconfig (墨西哥人的);cfg。TargetLang =“c++”;cfg。DeepLearningConfig =编码器。DeepLearningConfig (“cudnn”);cfg。GenerateReport = true;inputArgs = {ones(224,224,3,“uint8”), coder.Constant (matFile)};codegen配置cfgyolov2_detectarg游戏inputArgs
代码生成成功:查看报告
运行生成的MEX
设置视频文件读取器,读取输入视频。创建一个视频播放器来显示视频和输出检测。
videoFile =“highway_lanechange.mp4”;videoFreader =视觉。VideoFileReader (videoFile“VideoOutputDataType”,“uint8”);depVideoPlayer =视觉。DeployableVideoPlayer (“大小”,“自定义”,“CustomSize”480年[640]);
逐帧读取视频输入,使用检测器检测视频中的车辆。
cont = ~isDone(videoFreader);而cont I = step(video ofreader);in = imresize(I,[224,224]);out = yolov2_detect_mex(in,matFile);步骤(depVideoPlayer);%如果视频播放器图形窗口关闭,则退出循环cont = ~isDone(videoFreader) && isOpen(depVideoPlayer);结束
参考文献
雷蒙,约瑟夫和阿里·法哈蒂。“YOLO9000:更好、更快、更强。”2017年IEEE计算机视觉和模式识别会议。IEEE 2017。
版权所有:the MathWorks, Inc