主要内容

来自Matlab代码的内核创建

MATLAB代码结构和模式创建CUDA®GPU内核

GPU Coder™生成和执行优化CUDA内核的特定算法结构和模式在您的MATLAB®代码。生成的代码调用优化的NVIDIA®CUDA库,包括cuFFT, cuSolver, cuBLAS, cuDNN和TensorRT。生成的代码可以作为源代码、静态库或动态库集成到项目中,并且可以为NVIDIA Jetson、DRIVE和其他平台上的台式机、服务器和gpu编译。GPU编码器允许您将手写CUDA代码合并到您的算法和生成的代码。

应用程序

全部展开

GPU编码器 生成GPU代码MATLAB代码
GPU环境检查 验证并搭建GPU代码生成环境

功能

全部展开

codegen 生成C / C ++代码MATLAB代码
GPUCODER. 开放GPU编码器应用程序
Coder.CheckGPuInstall. 验证GPU代码生成环境
coder.gpuConfig 配置参数CUDA代码生成的MATLAB使用代码GPU编码器
一半 构造半精度数值对象
coder.gpu.kernel 编译指示映射-循环到GPU内核
coder.gpu.kernelfun 将函数映射到GPU内核的Pragma
coder.gpu.nokernel Pragma禁用内核创建循环
coder.gpu.constantMemory 将一个变量映射到GPU上的固定内存的Pragma
gpucoder.stencilKernel 创造CUDA模板函数的代码
gpucoder.matrixmatrixkernel. 优化GPU实现包含矩阵-矩阵运算的函数
gpucoder.batchedMatrixMultiply 优化GPU实现批量矩阵乘法运算
gpucoder.stringmatrixmultiply. 优化GPU实现矩阵式和批处理乘法运算
gpucoder.batchedMatrixMultiplyAdd 优化GPU实现批量矩阵乘法与加法运算
gpucoder.stridedMatrixMultiplyAdd 优化GPU实现跨步、批处理矩阵乘法与加法运算
coder.gpu.persistentMemory Pragma将变量分配为GPU上的持久存储器
gpucoder.sort 优化的GPU实现MATLAB排序函数
coder.gpu.torations. Pragma为代码生成器提供信息,用于在可变绑定循环上进行并行化决策
gpucoder.transpose 优化的GPU实现MATLAB转置矩阵函数
gpucoder.reduce 优化的GPU实现减少操作
编码器.CEVAL. 调用外部C/ c++函数

对象

全部展开

coder.gpuConfig 配置参数CUDA代码生成的MATLAB使用代码GPU编码器
coder.codeConfig 配置参数用于C/ c++代码生成MATLAB代码
编码器。EmbeddedCodeConfig 配置参数用于C/ c++代码生成MATLAB代码与嵌入式编码器
coder.gpuEnvConfig 创建包含传递的参数的配置对象Coder.CheckGPuInstall.用于执行GPU代码生成环境检查

主题

基于元素的循环的内核

从包含标量化的、元素智慧的数学运算的MATLAB函数创建内核。

来自散集类型操作的内核

从包含约简操作的MATLAB函数创建内核。

来自库调用的内核

目标GPU优化的数学库,如cuBLAS, cuSOLVER, cuFFT和Thrust。

金宝app支持GPU阵列

使用GPU阵列生成CUDA代码。

遗留代码集成

使用用于代码生成的MATLAB代码集成自定义GPU代码。

设计模式

为包含计算设计模式的MATLAB函数创建内核。

GPU内存分配和最小化

GPU编码器的内存分配选项和优化。

特色的例子