一些最常见的原因,为什么GPU Coder™生成的代码不像预期的表现:
CUDA®内核不会被创建。
主机到设备和设备到主机的内存传输(cudaMemcpy
)的节流性能。
并行度不够或设备问题。
这些主题详细说明了产生这些症状的常见原因,并描述了如何利用内置屏幕来检测这些问题。你可以找到关于如何解决这些问题并生成更有效的CUDA代码的信息。
GPU编码器故障排除工作流程。
创建和查看代码生成过程中生成的报告。
突出显示在GPU上运行的MATLAB代码。
创建和探索GPU静态代码指标报告。
生成高效CUDA内核的建议。
减少使用GPU编码器时的内存瓶颈问题。
细粒度剖面的MATLAB算法及其通过SIL生成的CUDA代码。
使用从NVIDIA Profiler (nvvp)获得的信息来提高性能。
查看GPU编码器的当前限制。