GPU编码器

GPU编码器

生成NVIDIA的CUDA代码gpu

开始:

产生快速、灵活的CUDA的代码

生成优化的CUDA代码。免版税的部署代码。

部署算法免版税

编译并运行你的受欢迎的NVIDIA gpu上生成的代码,从桌面系统到数据中心嵌入式硬件。生成的代码是royalty-free-deploy它你的客户免费的商业应用。

使用GPU编码器应用生成代码。

探索画廊图片(2)

从支持工具箱生成代码和功能金宝app

GPU编码器生成代码从一个广泛的MATLAB语言开发算法特性,设计工程师使用更大系统的组成部分。这包括数以百计的运营商和功能从MATLAB工具箱和伴侣。

MATLAB语言和工具箱支持代码生成。金宝app

MATLAB语言和工具箱支持代码生成。金宝app

将遗留代码

使用遗留代码的集成功能,可以把信任或高度优化的CUDA代码到你的MATLAB算法在MATLAB进行测试。然后调用相同的CUDA代码生成的代码。

将现有的CUDA代码合并到生成的代码。

将现有的CUDA代码合并到生成的代码。

从模型生成CUDA代码模型金宝app

创建模型在仿真软件和生成优化的CU金宝appDA的代码。

NVIDIA gpu的运行模拟和生成优化的代码

当使用仿真软件编码器,GPU加金宝app速编码器计算密集型的部分在你的仿真软件MATLAB函数块模型在NVIDIA GPU。然后您可以从仿真软件模型生成优化的CUDA代码并将其部署到你的NVIDIA GPU的目标。金宝app

金宝app仿真软件的模型运行在GPU Sobel边缘检测器。

金宝app仿真软件的模型运行在GPU Sobel边缘检测器。

部署的端到端深学习算法

使用多种训练的深度学习网络(包括ResNet-50、SegNet和LSTM)从深度学习工具箱仿真软件模型和部署NVIDIA gpu。金宝app生成代码的预处理和后处理连同你的训练有素的深度学习网络部署完整的算法。

测井信号,调整参数,数值验证代码的行为

当使用仿真软件编码器,GPU编金宝app码器使您能够实时日志信号和调优参数使用外部模式模拟。使用嵌入式编码器GPU编码器运行software-in-the-loop和processor-in-the-loop测试,数值验证生成的代码匹配的行为模拟。

从深度学习网络生成CUDA代码

部署与深度学习工具箱训练的深度学习网络。

部署的端到端深学习算法

部署各种训练的深度学习网络(包括ResNet-50、SegNet和LSTM)深度学习工具箱NVIDIA gpu。使用预定义的深度学习层或自定义为您的特定应用程序层。生成代码的预处理和后处理连同你的训练有素的深度学习网络部署完整的算法。

为推理生成优化的代码

GPU编码器生成代码与一个较小的足迹与其他深度学习解决方案,因为它只生成所需的代码运行推理与你的具体算法。金宝搏官方网站生成的代码调用优化库,包括TensorRT和cuDNN。

单张图片推断与VGG-16泰坦V使用cuDNN GPU。

单张图片推断与VGG-16泰坦V使用cuDNN GPU。

进一步优化使用TensorRT

生成的代码集成了NVIDIA TensorRT,高性能深度学习推理优化器和运行时。使用INT8或FP16额外的性能提升的数据类型在标准FP32数据类型。

提高执行速度与TensorRT INT8数据类型。

提高执行速度与TensorRT INT8数据类型。

深度学习量化

数字转换你的深度学习网络减少内存使用量和增加推理性能。分析和可视化性能和增加推理精度之间的权衡使用深层网络量化器应用程序。

优化生成的代码

GPU编码器自动优化生成的代码。使用设计模式来进一步提高性能。

最小化CPU-GPU记忆转移和优化内存使用

GPU编码器自动分析、识别和分区段MATLAB代码运行的CPU或GPU。它还减少CPU和GPU之间的数据副本的数量。使用分析工具来识别其他潜在的瓶颈。

概要报告识别潜在的瓶颈。

概要报告识别潜在的瓶颈。

调用优化图书馆

代码用GPU编码器生成调用优化NVIDIA CUDA库,包括TensorRT cuDNN, cuSolver, cuFFT, cuBLAS和推力。从MATLAB优化工具箱函数映射到生成的代码库。

生成的代码调用函数的优化cuFFT CUDA图书馆。

生成的代码调用函数的优化cuFFT CUDA图书馆。

为进一步加速使用设计模式

设计模式,比如模板处理使用共享内存来提高内存带宽。它们被应用时自动使用某些功能(如卷积。你也可以手动调用它们使用特定的语法。

模板处理设计模式。

模板处理设计模式。

原型硬件

去硬件快速的自动转换算法CUDA的代码。

英伟达杰森和驱动平台上的原型

交叉编译和部署的自动化生成的代码在NVIDIA杰森和驱动平台使用GPU编码器为NVIDIA GPU的支持包。金宝app

原型在NVIDIA杰森平台上。

原型在NVIDIA杰森平台上。

从MATLAB和生成的代码访问外围设备和传感器

远程与英伟达通信目标从MATLAB从摄像头获取数据和其他外设支持早期的原型。金宝app算法以及外围接口代码部署到独立执行。

从MATLAB和生成的代码访问外围设备和传感器。

从MATLAB和生成的代码访问外围设备和传感器。

从原型到生产

使用GPU编码器嵌入式编码MATLAB代码交互跟踪并排CUDA代码生成。验证的数值行为生成的代码运行在硬件上使用software-in-the-loop(银)和processor-in-the-loop(公益诉讼)测试。

互动可跟踪性报告使用GPU编码器和嵌入式编码。

互动可跟踪性报告使用GPU编码器和嵌入式编码。

加速算法

生成CUDA代码和编译里面使用MATLAB仿真软件。金宝app

在MATLAB中使用gpu加速算法

调用生成的CUDA代码作为一个墨西哥人函数从MATLAB代码执行速度,虽然性能取决于MATLAB代码的本质。配置文件生成的墨西哥人函数来识别瓶颈和集中你的优化工作。

使用NVIDIA gp金宝appu加速仿真软件模拟

当使用仿真软件编码器,GPU加金宝app速编码器计算密集型的部分在你的仿真软件MATLAB函数块模型在NVIDIA GPU。