Ram Cherukuri MathWorks
GPU编码器™生成优化的CUDA®从MATLAB代码®用于深度学习、嵌入式视觉和自主系统的代码。生成的代码调用优化的NVIDIA®CUDA库,可以作为源代码、静态库或动态库集成到你的项目中。它也可以用于图形处理器的原型设计,如NVIDIA Tesla®和NVIDIA Tegra®。
请参阅一个使用基于YOLO架构的深度学习神经网络的实时目标检测算法示例。这个单一的神经网络在一次评估中直接从输入图像预测边界框和类概率。如果概率高于某一阈值,则用边界框标识该对象。
使用cnncodegen
函数,您可以为您的神经网络生成CUDA代码,然后将生成的代码集成到更大的应用程序中。main函数使用OpenCV API读取输入图像,用边框框显示输出图像。使用这个工作流,您可以在嵌入式GPU目标上部署您的深度学习算法,如Jetson Tegra或Drive™PX平台。