主要内容

概要推理运行

这个示例展示了如何检索ResNet-18网络预测和分析器的结果。查看网络预测和性能数据层,卷积模块和完全在你pretrained深度学习网络连接模块。

  1. 创建一个类的对象工作流通过使用dlhdl.Workflow类。

    看到的,创建工作流对象通过使用属性名值对

  2. 设置一个pretrained深度学习网络和工作流对象的比特流。

    看到的,创建工作流对象通过使用属性名值对

  3. 创建一个类的对象dlhdl.Target并指定目标供应商和接口。看到的,dlhdl.Target

  4. 部署网络指定目标FPGA板上,调用部署工作流对象的方法。看到的,部署

  5. 调用预测工作流对象的函数。提供图片的数组InputImage参数。提供参数打开分析器。看到在FPGA使用量化神经网络分类图像

    图像分类的标签存储在一个结构结构体并显示在屏幕上。速度和延迟的性能参数中返回的结构结构体

使用这张图片来运行这段代码:

snet = resnet18;hT = dlhdl.Target (“Xilinx”,“界面”,“以太网”);hW = dlhdl.Workflow (“净”snet,“比特流”,“zcu102_single”,“目标”hT);hW.deploy;形象= imread (“zebra.jpeg”);inputImg = imresize(图像,(224、224));imshow (inputImg);(预测、速度)= hW.predict(单(inputImg),“配置文件”,“上”);[val, idx] = max(预测);snet.Layers(结束).ClassNames {idx}

# # #写完输入激活。# # #运行单个输入激活。深度学习处理器分析器性能结果LastFrameLatency(周期)LastFrameLatency总延迟(秒)FramesNum帧/ s - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -网络23659630 0.10754 572867 0.01011 23659630 9.3 conv1 23659630 pool1 0.00260 res2a_branch2a 0.00095 972699 0.00442 res2a_branch2b 972568 0.00442 209312年res2a res2b_branch2a 0.00095 972733 0.00442 res2b_branch2b 973022 0.00442 209736年res2b res3a_branch2a 0.00245 747507 0.00340 res3a_branch2b 904291 0.00411 538763年res3a_branch1 res3a 0.00411 104750 0.00048 res3b_branch2a 904389 0.00411 904367年res3b_branch2b res3b 0.00400 104886 0.00048 res4a_branch2a 485682 0.00221 880001年res4a_branch2b res4a_branch1 0.00400 486429 0.00221 res4a 52628 0.00024 880053年res4b_branch2a res4b_branch2b 880035 0.00400 52478年res4b 0.00024 res5a_branch2a 1056299 0.00480 res5a_branch1 res5a_branch2b 2056857 0.00935 1056510 0.00480 26170年res5a 0.00012 res5b_branch2a 0.00935 res5b 26381 0.00012 2057203 0.00935 res5b_branch2b 2057203 pool5 71405 0.00032 fc1000 216155 0.00098 * DL处理器的时钟频率是:220 mhz

性能分析数据返回这些参数及其值:

  • LastFrameLatency(周期)——总人数的前一帧时钟周期执行。

  • 时钟频率——时钟频率信息检索的比特流,用于部署网络到目标板。例如,分析器的回报* DL处理器的时钟频率:220 mhz。的时钟频率220 MHz的检索zcu102_single比特流。

  • LastFrameLatency(秒)——总秒数前一帧执行。的总时间计算LastFrameLatency /时钟频率(周期)。例如conv_moduleLastFrameLatency(秒)是计算2224115 / (220 * 10 ^ 6)

  • FramesNum——的总数输入帧到网络。这个值将用于计算帧/秒

  • 总延迟-总数的时钟周期执行的所有网络层和模块FramesNum

  • 帧/秒——在一秒钟的帧数处理网络。总帧/秒是计算(FramesNum *时钟频率)/总延迟。例如帧/秒的例子是计算(1 * 220 * 10 ^ 6)/ 23659630

另请参阅

||

相关的话题