GPU编码器

英伟达GPU에 활용할 수 있는 库达코드 생성

GPU编码器를사용하면MATLAB코드로부터최적화된CUDA코드를생성하여딥러닝,임베디드비,전자율시스템에활용할수있습니다。생성된코드는최적화NVIDIA CUDA라이브러리를호출하고,프로젝트에소스코드,정적라이브러리또는동적라이브러리로써통합시킬수있으며,NVIDIA Tesla나NVIDIA Tegra와같은GPU에프로토타이핑하는데사용할수있습니다。MATLAB내에서생성된CUDA를사용하여MATLAB코드에서계산집약적인부분을가속화할수있습니다。GPU编码器를이용하면MATLAB알고리즘과생성된코드에기존의CUDA코드를통합시킬수있습니다。

GPU编码器를 嵌入式编码器®와함께사용하여SIL (software-in-the-loop)테스팅을통해,생성된코드의결과를검증할수있습니다。

시작하기:

빠르고유연한CUDA코드생성

최적화CUDA코드생성。로열티없이코드배포。

로열티 없이 알고리즘 배포

코드를생성하고컴파일하여데스크탑시스템,데이터센터,임베디드하드웨어등에널리사용되는NVIDIA GPU에서실행하십시오。생성된코드는로열티가없습니다。상용응용프로그램에서고객에게무료로배포할수있습니다。

갤러리탐색(이미지2개)

GPU编码器성공 사례

다양한 업계에 종사하는 엔지니어와 과학자가 어떻게 GPU编码器를 이용하여 응용 프로그램용 库达코드를 생성하는지 살펴보십시오.

NVIDIA Jetson TX2에서 자동 결함 점검을 프로토타이핑하고 있는 空中客车公司。

지원되는툴박스및함수로부터코드생성

GPU编码器는다양하고폭넓은MATLAB언어기능을이용하여코드를생성합니다。설계엔지니어는이코드를이용해서더큰시스템의구성요소인알고리즘을개발할수있습니다。MATLAB및툴박스에는390개가넘는연산자및함수가포함되어있습니다。

코드 생성을 위한 MATLAB언어 및 툴박스 지원.

레거시코드통합

레거시 코드 통합 기능을 활용하여 신뢰할 수 있는 또는 최적화 수준이 높은 库达코드를 MATLAB알고리즘에 통합하고 테스트한 다음에, 생성된 코드에서 해당 库达코드를 호출해 보십시오.

생성된코드에기존CUDA코드를통합。

从Simulink模型生成CUDA代码金宝app

在Simulink中创建模型并生成金宝app优化的CUDA代码。

运行模拟和生成优化代码的NVIDIA gpu

当与Simulink Code金宝appr™一起使用时,GPU Coder可以加速你在NVIDIA GPU上的Simulink模型中的MATLAB函数块的计算密集型部分。然后,你可以从Simulink模型生成优化的CUDA代码,并将其部署到你的NVIDIA GPU目标。金宝app

金宝app在GPU上运行的Sobel边缘检测器的Simulink模型。

部署端到端深度学习算法

使用深度学习工具箱中经过培训的各种深度学习网络(包括ResNet-50、SegNet和LSTM)™ 在Simulink模型中,并部署到NVIDIA GPU。生成用于预处理和后处理的代码,以及经过培训的深度学习网络,以部署完整的算法。金宝app

在Simulink中使用ResNet-50对输入图像进行分类。金宝app

日志信号,调谐参数,数字验证代码行为

当与Simulink编码器一起金宝app使用时,GPU编码器使您能够使用外部模式模拟实时记录信号和调整参数。使用嵌入式编码器和GPU编码器运行软件在环测试和处理器在环测试,以数字方式验证生成的代码与模拟行为匹配。

使用外部模式在Simulink中记录信号并调整参数。金宝app

딥러닝네트워크에서CUDA코드생성

딥러닝툴박스를이용하여,학습된딥러닝네트워크를배포

엔드 투 엔드 딥러닝 알고리즘 배포

深度学习工具箱™에 있는 ResNet-50,SegNet등 학습된 다양한 딥러닝 네트워크를 英伟达GPU에 배포하십시오. 학습된 딥러닝 네트워크 이외에도, 전처리나 후처리에 사용되는 코드를 생성하여 전체 알고리즘을 배포하십시오.

SegNet을비롯한학습된다양한딥러닝네트워크를배포합니다。

추론을 위한 최적 코드를 생성

GPU编码器는 특정 알고리즘과 함께 추론을 실행하는 데 필요한 코드만 생성하기 때문에, 다른 딥러닝 솔루션에 비해 생성되는 코드가 작습니다. 생성된 코드는 坦索特™, cuDNN을 비롯한 최적화된 라이브러리를 호출합니다.

CuDNN을 이용하여 泰坦V GPU에서 VGG-16으로 단일 이미지 추론.

坦索特를 이용한 최적화

고성능딥러닝추론옵티마이저이며런타임라이브러리인NVIDIA TensorRT와통합하는코드를생성합니다。INT8또는FP16데이터형을이용하여,표준FP32데이터형에비해성능을한층업그레이드합니다。

坦索特와 INT8데이터형을 이용한 실행 속도 개선

딥러닝양자화

模型量化图书馆지원패키지를사용하여딥러닝신경망을INT8로양자화하고선택한계층의가중치와편향을양자화한결과에대한정확도의절충관계를분석할수있습니다。

하드웨어에서프로토타이핑

알고리즘을자동으로CUDA코드로변환시켜서하드웨어속도를높이십시오。

英伟达杰森및驱动플랫폼에대한프로토타이핑

GPU编码器™의NVIDIA®GPU지원 패키지를 활용하여, 생성된 코드를 자동으로 英伟达捷森酒店™ 및 驱力™ 플랫폼에 크로스 컴파일링하고 배포하십시오.

英伟达杰森플랫폼으로의프로토타이핑。

MATLAB및 생성된 코드로부터 주변기기와 센서에 액세스

MATLAB으로부터 英伟达타겟과 원격 통신을 하여, 웹캠과 기타 지원 주변기기에서 데이터를 획득하여 빠르게 프로토타이핑을 하십시오. 단독 실행을 위해 보드에 제공하는 주변기기 인터페이스 코드와 함께 알고리즘을 구축하고 배포하십시오.

MATLAB및생성된코드로부터주변기기와센서에액세스。

프로토타이핑에서시스템양산으로이동

GPU编码器와 嵌入式编码器®를이용하여,생성된CUDA코드와MATLAB코드를하나씩비교해가면서대화형으로추적하십시오。银(software-in-the-loop)및公益诉讼(processor-in-the-loop)테스팅을이용하여,하드웨어에서실행중인생성된코드의결과를확인하십시오。

GPU编码器와嵌入式编码器를활용한대화형추적가능성보고서。

优化生成的代码

GPU编码器自动优化生成的代码。使用设计模式进一步提高性能。

最小化CPU-GPU内存传输和优化内存使用

GPU编码器自动分析、识别和划分MATLAB代码段,以便在CPU或GPU上运行。它还最小化了CPU和GPU之间的数据拷贝数。使用分析工具识别其他潜在的瓶颈。

确定潜在瓶颈的概要报告。

调用优化的库

使用GPU编码器生成的代码调用优化的NVIDIA CUDA库,包括TensorRT, cuDNN, cuSolver, cuFFT, cuBLAS和Thrust。从MATLAB工具箱函数生成的代码将尽可能映射到优化的库中。

在优化的Cuft CUDA库中生成代码调用函数。

使用设计模式进一步加速

模具处理等设计模式使用共享内存来提高内存带宽。当使用某些函数(如卷积)时,它们会自动应用。您还可以使用特定的pragma手动调用它们。

模具加工设计图案。

알고리즘 가속화

库达코드를 생성하고 컴파일하여 MATLAB내부에서 사용하십시오.

GPU를 이용한 알고리즘 가속화

생성된CUDA코드를MATLAB코드에서墨西哥人함수로서호출하여,실행속도를높이십시오。다만성능은MATLAB코드의내용에따라달라질수있습니다。생성된墨西哥人함수를프로파일링하여병목현상을찾아내고최적화에집중하십시오。

使用NVIDIA GP金宝appU加速Simulink模拟

当与Simulink编码器一起金宝app使用时,GPU编码器可加速NVIDIA GPU上Simulink模型中MATLAB功能块的计算密集型部分。

최신기능

金宝app仿真软件的支持金宝app

生成,构建和部署Simulink模型到NVIDIA gp金宝appu

深度学习Simulink支持金宝app金宝app

在Simulink模型中生成、构建和部署深度学习网络到NVIDIA gpu金宝app

持续的变量

在GPU上创建持久内存

小波工具箱代码的生成

使用dwt, dwt2, modwt和modwtmra生成基于fft的FIR滤波和短时间傅里叶变换的代码

深度学习

为自定义层生成代码

多输入网络

为有多个输入的网络生成代码

长短期记忆(LSTM)网络

生成卷积LSTM和网络激活的代码

NVIDIA硬件的IO块库

使用NVIDIA GPU的GPU编码器支持包访问NVIDIA硬件外设金宝app

看到发布说明有关这些功能和相应功能的详细信息。