这个视频中凸显了查找表优化能力为乙状结肠函数生成一个高效的查找表,这是一个关键的激活函数用于深度学习网络。然后我们比较相对加速Arduino由于®和意法半导体®发现板使用生成的代码进行硬件在环仿真。
一个查找表是一个关键的构造为嵌入式设计,和常被用来加速运行时执行某些功能的算法。例如,复杂的三角函数通常替换为更有效的附近地区实现。
让我们尝试一个简单的实验,将相同的原则应用到乙状结肠函数探讨如何加快深度学习推理性能尤其是在边缘。
乙状结肠函数神经网络的关键构件,是一种常用的非线性激活函数用于深度学习网络。
这里有一个简单的仿真软件子系统,乙状结肠函数金宝app模型。我要使用查找表优化器应用程序来生成最优附近地区,指定输入和输出数据类型。由于这是一个有界函数,我可以指定输出最后的容忍界限产量的1%。
一旦优化问题已经解决了,我们可以看看情节的对比来验证的近似的误差是在我们指定的公差。
现在作为下一个步骤,让从乙状结肠函数生成C代码和生成的并将其部署到一个皮层M平台Arduino电路板。
运行生成的代码我们使用半实物仿真模型的输入。金宝app有一些开销在这种模式下运行的代码,但这仍然给了我们一个很好的对比的相对执行速度。
正如你所看到的执行概要,Arduino的2.5倍速度。我重复同样的测试在一个基于皮层M7的意法半导体发现董事会。这是一个阴谋显示相对加速查找表与不同的数据类型。
事实上,这可以扩大如果你能分享所有神经元之间的查找表近似,进一步降低数量级的执行速度。你可以做同样的实验与其他激活像双曲正切函数。
在设计中更多地了解优化附近地区,请参阅附加链接下面的视频。
你也可以从下面的列表中选择一个网站:
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。