主要内容

表现

疑难解答代码生成问题,改进代码执行时间,并减少生成代码的内存使用情况

GPU Coder™生成代码不按预期执行的一些最常见原因是:

  • CUDA.®没有创建内核。

  • 主机到设备和设备到托管内存传输(Cudamemcpy.)是节流性能。

  • 没有足够的平行性或设备问题。

这些主题详细阐述了这些症状的共同原因,并描述了如何利用内置筛选器来检测这些问题。您可以找到有关如何在这些问题上工作的信息并生成更高效的CUDA代码。

应用

展开全部

GPU编码器 生成GPU代码马铃薯代码
GPU环境检查 验证并设置GPU代码生成环境

职能

展开全部

Codegen. 生成C / C ++代码马铃薯代码
GPUCODER. 打开GPU编码器应用程序
gpucoder.profile 为生成的CUDA代码创建执行配置文件报告
coder.gpu.kernel. Pragma地图为了- 为GPU内核
coder.gpu.kernelfun. Pragma将函数映射到GPU内核
coder.gpu.nokernel. pragma禁用循环创建的内核创建

对象

展开全部

Coder.gpuconfig. 配置参数CUDA.代码生成马铃薯使用代码GPU编码器
coder.codeConfig C / C ++代码生成的配置参数马铃薯代码
Coder.embeddedCodeConfig C / C ++代码生成的配置参数马铃薯代码嵌入式编码器
coder.gpuenvconfig 创建包含传递的参数的配置对象Coder.CheckGPuInstall.用于执行GPU代码生成环境检查

话题

工作流程

GPU编码器故障排除工作流程。

代码生成报告

创建和查看代码生成期间生成的报告。

在生成的CUDA代码和MATLAB源代码之间追踪

突出显示在GPU上运行的MATLAB代码的部分。

生成用于从MATLAB代码生成的代码的GPU代码指标报告

创建和探索GPU静态代码指标报告。

内核分析

产生高效的CUDA内核的建议。

记忆瓶颈分析

使用GPU编码器时减少内存瓶颈问题。

分析生成代码的执行配置文件

MATLAB算法的细粒度分析及其通过SIL产生的CUDA代码。

用NVIDIA分析器分析

通过使用从NVIDIA分析器(NVVP)获得的信息来提高性能。

GPU编码器限制

请参阅GPU编码器的当前限制。

特色例子