主要内容

深度学习处理器体系结构

该软件提供了一个通用的深度学习处理器IP核心,是独立于目标,可以部署到任何您指定的定制平台。处理器可以重用和共享,以适应深各种层尺寸和参数的神经网络。使用该处理器快速原型深从MATLAB神经网络®,然后将网络部署到fpga。

这个图显示了深度学习处理器体系结构。

为了说明深层学习处理器架构,考虑一个图像分类的例子。

DDR外部存储器

你可以将输入图像、权重和输出图像外部DDR内存。处理器由四个AXI4主接口与外部存储器通信。使用AXI4主接口之一,您可以输入图像加载到块RAM (布拉姆)。块RAM提供的激活通用的卷积处理器

通用的卷积处理器

通用的卷积处理器执行操作相当于一个卷积层。使用另一个AXI4主界面,卷积操作提供的重量通用的卷积处理器。的通用的卷积处理器然后在输入图像执行卷积操作并提供的激活激活正常化。处理器是通用的,因为它可以支持各种大小的张量和形状。金宝app

激活正常化

根据你提供的神经网络,激活正常化模块可以添加ReLU非线性的目的,maxpool层,或执行当地反应正常化(LRN)。你看到处理器有两个激活正常化单位。一个单位的通用的卷积处理器。其他单位遵循通用的FC处理器

Conv控制器(调度)

根据卷积层的数量你pretrained网络Conv控制器(调度)作为乒乓缓冲。的通用的卷积处理器激活正常化可以处理一次一层。处理下一层,Conv控制器(调度)移动回布拉姆,然后执行卷积和激活规范化操作所有卷积层网络。

通用的FC处理器

通用的FC处理器执行相同操作的全层(FC)。使用另一个AXI4主界面,提供全层的权重通用的FC处理器。的通用的FC处理器然后在输入图像执行全层操作并提供的激活激活正常化模块。这个处理器也是通用的,因为它可以支持各种大小的张量和形状。金宝app

FC控制器(调度)

FC控制器(调度)类似于工作Conv控制器(调度)。的FC控制器(调度)坐标与先进先出作为执行全层操作和乒乓缓冲激活正常化根据FC层的数量,和ReLU, maxpool或LRN你神经网络的功能。后通用的FC处理器激活正常化模块过程中的所有帧图像,预测或分数通过AXI4主界面传输和存储在外部DDR内存。

深度学习处理器应用

一个应用程序的自定义深度学习处理器IP核心深度学习MATLAB控制处理器。创建这个处理器集成深度学习与高密度脂蛋白验证人™处理器IP MATLAB作为AXI主IP使用AXI4从接口。通过JTAG或串行总线接口,您可以导入各种pretrained从MATLAB神经网络,执行指定的操作网络深度学习处理器的IP,并返回MATLAB的分类结果。

有关更多信息,请参见MATLAB控制深度学习处理器