内核创建

创建CUDA的算法结构和模式®GPU内核

CUDA内核是在GPU设备上执行的函数。这些内核由许多GPU线程并行执行。通过高效地将算法的计算密集型部分映射到内核,您可以利用GPU计算技术提供的性能改进。可以触发GPU编码器™为MATLAB中的特定算法结构和模式创建CUDA内核®代码。

应用程序

GPU编码器 生成GPU代码MATLAB代码
检查显卡安装 验证并设置GPU代码生成环境

功能

一半 构造半精度的数值对象
coder.checkGpuInstall 验证GPU代码生成环境
coder.gpuConfig 配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器
codegen 生成C/ c++代码MATLAB代码
gpucoder 开放GPU编码器应用程序
coder.gpu.kernel 编译指示映射-对GPU内核的循环
coder.gpu.kernelfun 将函数映射到GPU内核的Pragma
coder.gpu.nokernel 为循环禁用内核创建
coder.gpu.constantMemory 将一个变量映射到GPU上的常量内存的Pragma
gpucoder.stencilKernel 创建CUDA模具功能代码
gpucoder.matrixMatrixKernel 优化GPU实现包含矩阵矩阵操作的函数
gpucoder.batchedMatrixMultiply 优化GPU实现批量矩阵乘法运算
gpucoder.stridedMatrixMultiply 优化GPU实现跨步矩阵乘法和批处理矩阵乘法运算
gpucoder.batchedMatrixMultiplyAdd 用加法运算优化GPU批量矩阵乘法的实现
gpucoder.stridedMatrixMultiplyAdd 优化GPU实现的大步,成批矩阵乘法与加法操作
gpucoder.sort 优化的GPU实现的MATLAB排序函数
coder.gpu.iterations 为代码生成器提供信息以在变量绑定循环上进行并行化决策的Pragma
gpucoder.transpose 优化的GPU实现的MATLAB转置矩阵函数
gpucoder.reduce 优化GPU实现的还原操作
coder.ceval 调用外部C/ c++函数

对象

coder.gpuConfig 配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器
coder.CodeConfig C/ c++代码生成的配置参数MATLAB代码
coder.EmbeddedCodeConfig C/ c++代码生成的配置参数MATLAB代码与嵌入式编码器
coder.gpuEnvConfig 创建包含传递给的参数的配置对象coder.checkGpuInstall用于执行GPU代码生成环境检查

主题

元素行循环的内核

从MATLAB函数中创建内核,这些函数包含标量化的、元素明智的数学操作。

来自分散-聚集类型操作的内核

从包含约简操作的MATLAB函数中创建内核。

来自库调用的内核

目标GPU优化的数学库,如cuBLAS, cuSOLVER, cuFFT,和推力。

金宝app对GPU阵列的支持

使用GPU阵列生成CUDA代码。

遗留代码集成

将定制的GPU代码与用于代码生成的MATLAB代码集成在一起。

设计模式

为包含计算设计模式的MATLAB函数创建内核。

GPU内存分配和最小化

内存分配选项和优化GPU编码器。

特色的例子