GPU Coder™生成代码不按预期执行的一些最常见原因是:
CUDA.®没有创建内核。
主机到设备和设备到托管内存传输(Cudamemcpy.
)是节流性能。
没有足够的平行性或设备问题。
这些主题详细阐述了这些症状的共同原因,并描述了如何利用内置筛选器来检测这些问题。您可以找到有关如何在这些问题上工作的信息并生成更高效的CUDA代码。
GPU编码器故障排除工作流程。
创建和查看代码生成期间生成的报告。
突出显示在GPU上运行的MATLAB代码的部分。
创建和探索GPU静态代码指标报告。
产生高效的CUDA内核的建议。
使用GPU编码器时减少内存瓶颈问题。
MATLAB算法的细粒度分析及其通过SIL产生的CUDA代码。
通过使用从NVIDIA分析器(NVVP)获得的信息来提高性能。
请参阅GPU编码器的当前限制。