深度学习处理器体系结构
该软件提供了一个通用的深度学习处理器IP核心,是独立于目标,可以部署到任何您指定的定制平台。处理器可以重用和共享,以适应深各种层尺寸和参数的神经网络。使用该处理器快速原型深从MATLAB神经网络®,然后将网络部署到fpga。
这个图显示了深度学习处理器体系结构。
为了说明深层学习处理器架构,考虑一个图像分类的例子。
DDR外部存储器
你可以将输入图像、权重和输出图像外部DDR内存。处理器由四个AXI4主接口与外部存储器通信。使用AXI4主接口之一,您可以输入图像加载到块RAM (布拉姆
)。块RAM提供的激活通用的卷积处理器
。
通用的卷积处理器
的通用的卷积处理器
执行操作相当于一个卷积层。使用另一个AXI4主界面,卷积操作提供的重量通用的卷积处理器
。的通用的卷积处理器
然后在输入图像执行卷积操作并提供的激活激活正常化
。处理器是通用的,因为它可以支持各种大小的张量和形状。金宝app
激活正常化
根据你提供的神经网络,激活正常化
模块可以添加ReLU非线性的目的,maxpool层,或执行当地反应正常化(LRN)。你看到处理器有两个激活正常化
单位。一个单位的通用的卷积处理器
。其他单位遵循通用的FC处理器
。
Conv控制器(调度)
根据卷积层的数量你pretrained网络Conv控制器(调度)
作为乒乓缓冲。的通用的卷积处理器
和激活正常化
可以处理一次一层。处理下一层,Conv控制器(调度)
移动回布拉姆,然后执行卷积和激活规范化操作所有卷积层网络。
通用的FC处理器
的通用的FC处理器
执行相同操作的全层(FC)。使用另一个AXI4主界面,提供全层的权重通用的FC处理器
。的通用的FC处理器
然后在输入图像执行全层操作并提供的激活激活正常化
模块。这个处理器也是通用的,因为它可以支持各种大小的张量和形状。金宝app
FC控制器(调度)
的FC控制器(调度)
类似于工作Conv控制器(调度)
。的FC控制器(调度)
坐标与先进先出
作为执行全层操作和乒乓缓冲激活正常化
根据FC层的数量,和ReLU, maxpool或LRN你神经网络的功能。后通用的FC处理器
和激活正常化
模块过程中的所有帧图像,预测或分数通过AXI4主界面传输和存储在外部DDR内存。
深度学习处理器应用
一个应用程序的自定义深度学习处理器IP核心深度学习MATLAB控制处理器。创建这个处理器集成深度学习与高密度脂蛋白验证人™处理器IP MATLAB作为AXI主IP使用AXI4从接口。通过JTAG或串行总线接口,您可以导入各种pretrained从MATLAB神经网络,执行指定的操作网络深度学习处理器的IP,并返回MATLAB的分类结果。
有关更多信息,请参见MATLAB控制深度学习处理器。