使用GPU加速雷达模拟NVIDIA GPU编码器
学习GPU编码器™可以加速在NVIDIA高计算应用于信号和图像处理®gpu。使用SAR处理的示例中,我们演示如何减少仿真时间的数量级。
gpu的大规模并行计算能力是启用和加速各种高性能计算任务。在这段视频中我们将考虑如何适用于雷达应用程序和我们如何使用GPU编码器可以在GPU加速这类应用程序。
我们将使用一个合成孔径雷达处理示例说明由于SAR是常用的机载雷达,它也被用于汽车雷达的应用程序。
SAR使用雷达天线的运动对目标地区提供更好的空间分辨率比传统的波束扫描雷达。
这里有我们的原始回波数据三分目标和情节表明天线的运动。
你合成的SAR图像的连续记录雷达回波脉冲用来照亮目标从一个移动的天线。
这里有我们的算法,使用时域反向传播构建SAR图像的三分和注意,高度并行算法,包括三个for循环。
得到预期的SAR图像的三分让我们注意的处理时间。算法需要大约3000秒桌面上CPU 2000 x10000大小输入数据。
利用该算法的并行性,加快在GPU,我们要利用墨西哥人的工作流,我们从这个算法生成CUDA代码并运行编译CUDA从MATLAB代码。
您可以看到编译CUDA代码运行起来要快两个数量级。
代码生成的报告给你额外的信息和见解在生成的代码。
例如,绿色的亮点,显示生成的代码的映射到GPU,在本例中,整个函数映射到GPU。
度量报告中你可以看到更多细节关于内核线程和块分配。在这里生成的代码有一个内核和我们只使用四个街区。
但我们有三个循环算法和有可能调整算法,使之更数据并行。
只要将这些三行代码内部循环,两外循环现在完全嵌套在不改变代码的行为。如果我们运行生成的墨西哥人,我们看到一个额外的10倍加速。你可以进一步控制并行通过指定其他参数如内核编译指示的块大小。
现在更进一步,使用gpucoder。概要文件,我们可以形象和获得时间信息,让你探索的相对时间处理内核与时间花在GPU的来回移动数据。
这可以进一步帮助您识别更多的方法来更新您的应用程序来提高性能。
这些原则可以用来加速其他信号处理和雷达应用程序以及计算机视觉和图像处理应用程序。
请参考下面的文档链接发布视频了解更多信息。
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。