深度学习HDL Toolbox™支持串联卷积神经网络(金宝appCNN或Convnets)的代码生成。您可以为任何训练有素的卷积神经网络生成代码,其计算层支持代码生成。金宝app看金宝app支撑层。您可以使用表中列出的一个预告片的网络,并为目标Intel生成代码®或xilinx®FPGA董事会。
网络 | 网络描述 | 类型 | 单个数据类型(带有运输bitstreams) | INT8数据类型(带有运输的Bitstreams) | 应用区 | ||||
ZCU102 | ZC706 | Arria10 Soc | ZCU102 | ZC706 | Arria10 Soc | 分类 | |||
Alexnet | Alexnet卷积神经网络。 |
系列网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 分类 |
登录 | 徽标识别网络(logonet)是MATLAB®开发的徽标标识网络。有关更多信息,请参阅徽标识别网络。 |
系列网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 分类 |
mnist | MNIST数字分类。看创建简单的深度学习网络进行分类 |
系列网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 分类 |
车道检测 | LANENet卷积神经网络。有关更多信息,请参阅部署转移学习网络进行车道检测 |
系列网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 分类 |
VGG-16 | VGG-16卷积神经网络。有关验证的VGG-16型号,请参见 |
系列网络 | 网络超过PL DDR内存大小 | 编号网络超过FC模块内存大小。 | 是的 | 是的 | 编号网络超过FC模块内存大小。 | 是的 | 分类 |
VGG-19 | VGG-19卷积神经网络。有关验证的VGG-19型号,请参见 |
系列网络 | 网络超过PL DDR内存大小 | 编号网络超过FC模块内存大小。 | 是的 | 是的 | 编号网络超过FC模块内存大小。 | 是的 | 分类 |
Darknet-19 | DarkNet-19卷积神经网络。对于预算的DarkNet-19模型,请参见 |
系列网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 分类 |
雷达分类 | 卷积神经网络,使用Micro-Doppler签名来识别和分类对象。有关更多信息,请参阅骑自行车的人和行人分类使用FPGA。 | 系列网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 分类和软件定义的无线电(SDR) |
缺陷检测SNET_DEFNET |
SNET_DEFNET 是用于识别和分类缺陷的自定义Alexnet网络。有关更多信息,请参阅缺陷检测。 |
系列网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 分类 |
缺陷检测snet_blemdetnet |
snet_blemdetnet 是用于识别和分类缺陷的自定义卷积神经网络。有关更多信息,请参阅缺陷检测。 |
系列网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 分类 |
Yolo V2车辆检测 | 您只看一次(Yolo)是一个对象检测器,它可以从卷积神经网络中解码预测并在对象周围生成边界框。有关更多信息,请参阅使用部署到FPGA的YOLO V2的车辆检测 | 基于系列网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 对象检测 |
Darknet-53 | Darknet-53卷积神经网络。对于预算的Darknet-53模型,请参见darknet53 。 |
基于定向的无环图(DAG)网络 | 编号网络超过PL DDR内存大小。 | 编号网络超过PL DDR内存大小。 | 是的 | 是的 | 是的 | 是的 | 分类 |
RESNET-18 | RESNET-18卷积神经网络。对于预验证的RESNET-18模型,请参见RESNET18 。 |
基于定向的无环图(DAG)网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 分类 | |
Resnet-50 | Resnet-50卷积神经网络。对于预验证的Resnet-50型号,请参见RESNET50 。 |
基于定向的无环图(DAG)网络 | 编号网络超过PL DDR内存大小。 | 编号网络超过PL DDR内存大小。 | 是的 | 是的 | 是的 | 是的 | 分类 |
基于重新连接的Yolo V2 | 您只看一次(Yolo)是一个对象检测器,它可以从卷积神经网络中解码预测并在对象周围生成边界框。有关更多信息,请参阅使用基于DAG网络的Yolo V2部署到FPGA的车辆检测。 | 基于定向的无环图(DAG)网络 | 是的 | 是的 | 是的 | 是的 | 是的 | 是的 | 对象检测 |
MobileNetV2 | Mobilenet-V2卷积神经网络。对于预审前的Mobilenet-V2模型,请参见MobileNetV2 。 |
基于定向的无环图(DAG)网络 | 是的 | 是的 | 是的 | 不 | 不 | 不 | 分类 |
深度学习HDL工具箱支持以下层。金宝app
层 | 层类型硬件(HW)或软件(SW) | 描述和局限性 | INT8兼容 |
SW | 图像输入层将2-D图像输入到网络并应用数据归一化。 |
是的。在SW中作为单个数据类型运行。 |
层 | 层类型硬件(HW)或软件(SW) | 层输出格式 | 描述和局限性 | INT8兼容 |
HW | 卷积(Cons) | 2D卷积层将滑动卷积过滤器应用于输入。 使用此层为网络生成代码时,这些限制适用:
|
是的 |
|
HW | 卷积(Cons) | 2D分组的卷积层将输入通道分为组,并应用滑动卷积过滤器。使用分组的卷积层进行通道可分离(也称为深度可分离)卷积。 现在支持一个具有2D分组的卷积层的代码生成金宝app 使用此层为网络生成代码时,这些限制适用:
|
是的 |
|
HW | 完全连接(FC) | 完全连接的层将输入乘以重量矩阵,然后添加偏置向量。 使用此层为网络生成代码时,这些限制适用:
|
是的 |
层 | 层类型硬件(HW)或软件(SW) | 层输出格式 | 描述和局限性 | INT8兼容 |
HW | 层被融合。 | Relu层对输入的每个元素执行阈值操作,其中任何小于零的值都设置为零。 只有在此之前的任何一个层之前,才金宝app能支持relu层:
|
是的 |
|
HW | 层被融合。 | 漏水层执行阈值操作,其中任何小于零的输入值乘以固定标量。 只有在任何这些层之前,仅在漏水层才能支持泄漏金宝app的层:
|
是的 |
|
HW | 层被融合。 | 剪切的relu层执行阈值操作,其中任何小于零的输入值设置为零,并且上方的任何值剪裁天花板设置为剪裁天花板值。 只有在任何这些层之前,才能支持剪切的莱卢层:金宝app
|
是的 |
层 | 层类型硬件(HW)或软件(SW) | 层输出格式 | 描述和局限性 | INT8兼容 |
HW | 层被融合。 | 批处理层次层使每个输入通道跨小批量归一化。 仅当批准层仅在卷积层之前才能支持批准层。金宝app |
是的 |
|
HW | 卷积(Cons) | 通过渠道的局部响应(跨渠道)归一化层进行通道归一化。 这 |
是的。在HW中作为单个数据类型运行。 |
|
关于推理 | 关于推理 | 辍学层随机将输入元素随机设置为零,并具有给定的概率。 |
是的 |
层 | 层类型硬件(HW)或软件(SW) | 层输出格式 | 描述和局限性 | INT8兼容 |
HW | 卷积(Cons) | 最大池层通过将输入分为矩形池区域并计算每个区域的最大值来对下进行采样。 使用此层为网络生成代码时,这些限制适用:
|
是的 |
|
HW | 卷积(Cons) | 平均池层通过将输入分为矩形池区域并计算每个区域的平均值来进行降低采样。 使用此层为网络生成代码时,这些限制适用:
|
是的 |
|
HW | 卷积(CONS)或完全连接(FC)。当输入激活大小低于内存阈值时,层输出格式为FC。 | 全局平均池层通过计算输入的高度和宽度维度的平均值来下降采样。 使用此层为网络生成代码时,这些限制适用:
|
是的 |
层 | 层类型硬件(HW)或软件(SW) | 层输出格式 | 描述和局限性 | INT8兼容 |
HW | 从输入继承。 | 加法层添加了来自多个神经网络层元素的输入。 使用此层为网络生成代码时,这些限制适用:
|
是的 | |
HW | 从输入继承。 | 深度串联层采用具有相同高度和宽度的输入,并沿第三维(通道维度)连接它们。 使用此层为网络生成代码时,这些限制适用:
|
不 |
层 | 层类型硬件(HW)或软件(SW) | 层输出格式 | 描述和局限性 | INT8兼容 |
nnet.keras.layer.flattencstylayer |
HW | 层将融合 | 假定C风格(行 - 尺)顺序的1D层将激活变平。 一个 |
是的 |
nnet.keras.layer.zeropadding2dlayer |
HW | 层将融合。 | 2D输入的零填充层。 一个 |
是的 |
这些板由深度学习HDL工具箱支持:金宝app
Xilinx Zynq®-7000 ZC706。
英特尔·阿里亚(Intel Arria)®10 Soc。
Xilinx Zynq Ultrascale+™MPSOC ZCU102。
深度学习HDL工具箱已进行了测试:
Xilinx Vivado Design Suite 2020.1
英特尔Quartus Prime 18.1