CUDA内核是在GPU设备上执行的函数。这些内核由许多GPU线程并行执行。通过高效地将算法的计算密集型部分映射到内核,您可以利用GPU计算技术提供的性能改进。可以触发GPU编码器™为MATLAB中的特定算法结构和模式创建CUDA内核®代码。
一半 |
构造半精度的数值对象 |
coder.checkGpuInstall |
验证GPU代码生成环境 |
coder.gpuConfig |
配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器 |
codegen |
生成C/ c++代码MATLAB代码 |
gpucoder |
开放GPU编码器应用程序 |
coder.gpu.kernel |
编译指示映射为 -对GPU内核的循环 |
coder.gpu.kernelfun |
将函数映射到GPU内核的Pragma |
coder.gpu.nokernel |
为循环禁用内核创建 |
coder.gpu.constantMemory |
将一个变量映射到GPU上的常量内存的Pragma |
gpucoder.stencilKernel |
创建CUDA模具功能代码 |
gpucoder.matrixMatrixKernel |
优化GPU实现包含矩阵矩阵操作的函数 |
gpucoder.batchedMatrixMultiply |
优化GPU实现批量矩阵乘法运算 |
gpucoder.stridedMatrixMultiply |
优化GPU实现跨步矩阵乘法和批处理矩阵乘法运算 |
gpucoder.batchedMatrixMultiplyAdd |
用加法运算优化GPU批量矩阵乘法的实现 |
gpucoder.stridedMatrixMultiplyAdd |
优化GPU实现的大步,成批矩阵乘法与加法操作 |
gpucoder.sort |
优化的GPU实现的MATLAB排序函数 |
coder.gpu.iterations |
为代码生成器提供信息以在变量绑定循环上进行并行化决策的Pragma |
gpucoder.transpose |
优化的GPU实现的MATLAB转置矩阵函数 |
gpucoder.reduce |
优化GPU实现的还原操作 |
coder.ceval |
调用外部C/ c++函数 |
coder.gpuConfig |
配置参数CUDA代码生成的MATLAB代码通过使用GPU编码器 |
coder.CodeConfig |
C/ c++代码生成的配置参数MATLAB代码 |
coder.EmbeddedCodeConfig |
C/ c++代码生成的配置参数MATLAB代码与嵌入式编码器 |
coder.gpuEnvConfig |
创建包含传递给的参数的配置对象coder.checkGpuInstall 用于执行GPU代码生成环境检查 |
从MATLAB函数中创建内核,这些函数包含标量化的、元素明智的数学操作。
从包含约简操作的MATLAB函数中创建内核。
目标GPU优化的数学库,如cuBLAS, cuSOLVER, cuFFT,和推力。
使用GPU阵列生成CUDA代码。
将定制的GPU代码与用于代码生成的MATLAB代码集成在一起。
为包含计算设计模式的MATLAB函数创建内核。
内存分配选项和优化GPU编码器。