主要内容

金宝app支持的网络,层,板和工具

金宝app支持的审慎网络

深度学习HDL Toolbox™支持串联卷积神经网络(金宝appCNN或Convnets)的代码生成。您可以为任何训练有素的卷积神经网络生成代码,其计算层支持代码生成。金宝app看金宝app支撑层。您可以使用表中列出的一个预告片的网络,并为目标Intel生成代码®或xilinx®FPGA董事会。

网络 网络描述 类型 单个数据类型(带有运输bitstreams) INT8数据类型(带有运输的Bitstreams) 应用区
ZCU102 ZC706 Arria10 Soc ZCU102 ZC706 Arria10 Soc 分类
Alexnet

Alexnet卷积神经网络。

系列网络 是的 是的 是的 是的 是的 是的 分类
登录

徽标识别网络(logonet)是MATLAB®开发的徽标标识网络。有关更多信息,请参阅徽标识别网络

系列网络 是的 是的 是的 是的 是的 是的 分类
mnist

MNIST数字分类。看创建简单的深度学习网络进行分类

系列网络 是的 是的 是的 是的 是的 是的 分类
车道检测

LANENet卷积神经网络。有关更多信息,请参阅部署转移学习网络进行车道检测

系列网络 是的 是的 是的 是的 是的 是的 分类
VGG-16

VGG-16卷积神经网络。有关验证的VGG-16型号,请参见VGG16

系列网络 网络超过PL DDR内存大小 编号网络超过FC模块内存大小。 是的 是的 编号网络超过FC模块内存大小。 是的 分类
VGG-19

VGG-19卷积神经网络。有关验证的VGG-19型号,请参见VGG19

系列网络 网络超过PL DDR内存大小 编号网络超过FC模块内存大小。 是的 是的 编号网络超过FC模块内存大小。 是的 分类
Darknet-19

DarkNet-19卷积神经网络。对于预算的DarkNet-19模型,请参见Darknet19

系列网络 是的 是的 是的 是的 是的 是的 分类
雷达分类 卷积神经网络,使用Micro-Doppler签名来识别和分类对象。有关更多信息,请参阅骑自行车的人和行人分类使用FPGA 系列网络 是的 是的 是的 是的 是的 是的 分类和软件定义的无线电(SDR)
缺陷检测SNET_DEFNET SNET_DEFNET是用于识别和分类缺陷的自定义Alexnet网络。有关更多信息,请参阅缺陷检测 系列网络 是的 是的 是的 是的 是的 是的 分类
缺陷检测snet_blemdetnet snet_blemdetnet是用于识别和分类缺陷的自定义卷积神经网络。有关更多信息,请参阅缺陷检测 系列网络 是的 是的 是的 是的 是的 是的 分类
Yolo V2车辆检测 您只看一次(Yolo)是一个对象检测器,它可以从卷积神经网络中解码预测并在对象周围生成边界框。有关更多信息,请参阅使用部署到FPGA的YOLO V2的车辆检测 基于系列网络 是的 是的 是的 是的 是的 是的 对象检测
Darknet-53 Darknet-53卷积神经网络。对于预算的Darknet-53模型,请参见darknet53 基于定向的无环图(DAG)网络 编号网络超过PL DDR内存大小。 编号网络超过PL DDR内存大小。 是的 是的 是的 是的 分类
RESNET-18 RESNET-18卷积神经网络。对于预验证的RESNET-18模型,请参见RESNET18 基于定向的无环图(DAG)网络 是的 是的 是的 是的 是的 分类
Resnet-50 Resnet-50卷积神经网络。对于预验证的Resnet-50型号,请参见RESNET50 基于定向的无环图(DAG)网络 编号网络超过PL DDR内存大小。 编号网络超过PL DDR内存大小。 是的 是的 是的 是的 分类
基于重新连接的Yolo V2 您只看一次(Yolo)是一个对象检测器,它可以从卷积神经网络中解码预测并在对象周围生成边界框。有关更多信息,请参阅使用基于DAG网络的Yolo V2部署到FPGA的车辆检测 基于定向的无环图(DAG)网络 是的 是的 是的 是的 是的 是的 对象检测
MobileNetV2 Mobilenet-V2卷积神经网络。对于预审前的Mobilenet-V2模型,请参见MobileNetV2 基于定向的无环图(DAG)网络 是的 是的 是的 分类

金宝app支撑层

深度学习HDL工具箱支持以下层。金宝app

输入层

层类型硬件(HW)或软件(SW) 描述和局限性 INT8兼容

ImageInputlayer

SW

图像输入层将2-D图像输入到网络并应用数据归一化。

是的。在SW中作为单个数据类型运行。

卷积和完全连接的层

层类型硬件(HW)或软件(SW) 层输出格式 描述和局限性 INT8兼容

卷积2Dlayer

HW 卷积(Cons)

2D卷积层将滑动卷积过滤器应用于输入。

使用此层为网络生成代码时,这些限制适用:

  • 滤波器尺寸必须为1-14和正方形。例如[1 1]或[14 14]。

  • 步幅大小必须为1-12和正方形。

  • 填充大小必须在0-8范围内。

  • 扩张因子必须为[1 1]。

  • 不支持填充值。金宝app

是的

groupedConvolution2Dlayer

HW 卷积(Cons)

2D分组的卷积层将输入通道分为组,并应用滑动卷积过滤器。使用分组的卷积层进行通道可分离(也称为深度可分离)卷积。

现在支持一个具有2D分组的卷积层的代码生成金宝app数字属性集为“渠道”

使用此层为网络生成代码时,这些限制适用:

  • 滤波器尺寸必须为1-14和正方形。例如[1 1]或[14 14]。当。。。的时候数字设置为“渠道”,滤波器大小必须为3-14。

  • 步幅大小必须为1-12和正方形。

  • 填充大小必须在0-8范围内。

  • 扩张因子必须为[1 1]。

  • 组的数量必须为1或2。

是的

完整连接的layerer

HW 完全连接(FC)

完全连接的层将输入乘以重量矩阵,然后添加偏置向量。

使用此层为网络生成代码时,这些限制适用:

是的

激活层

层类型硬件(HW)或软件(SW) 层输出格式 描述和局限性 INT8兼容

Relulayer

HW 层被融合。

Relu层对输入的每个元素执行阈值操作,其中任何小于零的值都设置为零。

只有在此之前的任何一个层之前,才金宝app能支持relu层:

  • 卷积层

  • 完全连接的层

  • 加法器层

是的

LeakyyRelulayer

HW 层被融合。

漏水层执行阈值操作,其中任何小于零的输入值乘以固定标量。

只有在任何这些层之前,仅在漏水层才能支持泄漏金宝app的层:

  • 卷积层

  • 完全连接的层

  • 加法器层

是的

剪辑器

HW 层被融合。

剪切的relu层执行阈值操作,其中任何小于零的输入值设置为零,并且上方的任何值剪裁天花板设置为剪裁天花板值。

只有在任何这些层之前,才能支持剪切的莱卢层:金宝app

  • 卷积层

  • 完全连接的层

  • 加法器层

是的

标准化,辍学和裁剪层

层类型硬件(HW)或软件(SW) 层输出格式 描述和局限性 INT8兼容

batchnormalizationlayer

HW 层被融合。

批处理层次层使每个输入通道跨小批量归一化。

仅当批准层仅在卷积层之前才能支持批准层。金宝app

是的

交叉渠道层层

HW 卷积(Cons)

通过渠道的局部响应(跨渠道)归一化层进行通道归一化。

窗口通道必须在代码生成的3-9范围内。

是的。在HW中作为单个数据类型运行。

dropoutlayer

关于推理 关于推理

辍学层随机将输入元素随机设置为零,并具有给定的概率。

是的

合并和不化层

层类型硬件(HW)或软件(SW) 层输出格式 描述和局限性 INT8兼容

maxpooling2dlayer

HW 卷积(Cons)

最大池层通过将输入分为矩形池区域并计算每个区域的最大值来对下进行采样。

使用此层为网络生成代码时,这些限制适用:

  • 游泳池尺寸必须为1-14和正方形。例如[1 1]或[12 12]。

  • 步幅大小必须为1-7和正方形。

  • 填充大小必须在0-2范围内。

是的

平均泵2Dlayer

HW 卷积(Cons)

平均池层通过将输入分为矩形池区域并计算每个区域的平均值来进行降低采样。

使用此层为网络生成代码时,这些限制适用:

  • 游泳池尺寸必须为1-14和正方形。例如[3 3]

  • 步幅大小必须为1-7和正方形。

  • 填充大小必须在0-2范围内。

是的

globalaveragePooling2Dlayer

HW 卷积(CONS)或完全连接(FC)。当输入激活大小低于内存阈值时,层输出格式为FC。

全局平均池层通过计算输入的高度和宽度维度的平均值来下降采样。

使用此层为网络生成代码时,这些限制适用:

  • 对于基于CONS模块的全局平均池层,池尺寸值必须在1-14范围内,对于基于FC的全球平均池层,必须在1-12中。池尺寸值必须为正方形。例如,[1 1]或[12 12]。

  • 总激活像素大小必须小于深度学习处理器卷积模块输入内存大小。有关更多信息,请参阅InputMemorysize

是的

组合层

层类型硬件(HW)或软件(SW) 层输出格式 描述和局限性 INT8兼容

加法器

HW 从输入继承。

加法层添加了来自多个神经网络层元素的输入。

使用此层为网络生成代码时,这些限制适用:

  • 当输入数据类型为INT8时,加法层的最大输入数为两个。

  • 两个输入层必须具有相同的输出层格式。例如,两层都必须具有CORV输出格式或FC输出格式。

是的

DepthCatenationLayer

HW 从输入继承。

深度串联层采用具有相同高度和宽度的输入,并沿第三维(通道维度)连接它们。

使用此层为网络生成代码时,这些限制适用:

  • 输入激活特征编号必须是该平方根的倍数condthreadnumber

  • 对深度串联层的输入必须是深度串联层的独有的。

  • 具有FC输出格式的CONS输出格式和层的层不能被串联在一起。

输出层

层类型硬件(HW)或软件(SW) 描述和局限性 INT8兼容

SoftMax

SW

SoftMax层将SoftMax函数应用于输入。

是的。在SW中作为单个数据类型运行。

分类器

SW

分类层计算与相互排斥类的多类分类问题的跨凝结损失。

是的

回归层

SW

回归层为回归问题计算半均值的误差损失。

是的

Keras和Onnx层

层类型硬件(HW)或软件(SW) 层输出格式 描述和局限性 INT8兼容
nnet.keras.layer.flattencstylayer HW 层将融合

假定C风格(行 - 尺)顺序的1D层将激活变平。

一个nnet.keras.layer.flattencstylayer仅在接下来是完全金宝app连接的层后才支持。

是的

nnet.keras.layer.zeropadding2dlayer HW 层将融合。

2D输入的零填充层。

一个nnet.keras.layer.zeropadding2dlayer仅在接下来是卷积金宝app层或Maxpool层后才支持。

是的

金宝app支持的董事会

这些板由深度学习HDL工具箱支持:金宝app

  • Xilinx Zynq®-7000 ZC706。

  • 英特尔·阿里亚(Intel Arria)®10 Soc。

  • Xilinx Zynq Ultrascale+™MPSOC ZCU102。

第三方合成工具和版本支持金宝app

深度学习HDL工具箱已进行了测试:

  • Xilinx Vivado Design Suite 2020.1

  • 英特尔Quartus Prime 18.1

相关话题