GPU编码器

英伟达GPU에 활용할 수 있는 库达코드 생성

비디오 보기

평가판 요청

GPU编码器를사용하면MATLAB코드로부터최적화된CUDA코드를생성하여딥러닝,임베디드비,전자율시스템에활용할수있습니다。생성된코드는최적화NVIDIA CUDA라이브러리를호출하고,프로젝트에소스코드,정적라이브러리또는동적라이브러리로써통합시킬수있으며,NVIDIA Tesla나NVIDIA Tegra와같은GPU에프로토타이핑하는데사용할수있습니다。MATLAB내에서생성된CUDA를사용하여MATLAB코드에서계산집약적인부분을가속화할수있습니다。GPU编码器를이용하면MATLAB알고리즘과생성된코드에기존의CUDA코드를통합시킬수있습니다。

GPU编码器를 嵌入式编码器^®와함께사용하여SIL (software-in-the-loop)테스팅을통해,생성된코드의결과를검증할수있습니다。

시작하기:

무료백서:
MATLAB에서CUDA코드생성

다운로드

빠르고유연한CUDA코드생성

최적화CUDA코드생성。로열티없이코드배포。

로열티 없이 알고리즘 배포

코드를생성하고컴파일하여데스크탑시스템,데이터센터,임베디드하드웨어등에널리사용되는NVIDIA GPU에서실행하십시오。생성된코드는로열티가없습니다。상용응용프로그램에서고객에게무료로배포할수있습니다。

안개(雾)수정알고리즘용CUDA코드생성하기(2:22)

GPU코드생성:맨들브로트집합

갤러리탐색(이미지2개)

GPU编码器성공 사례

다양한 업계에 종사하는 엔지니어와 과학자가 어떻게 GPU编码器를 이용하여 응용 프로그램용 库达코드를 생성하는지 살펴보십시오.

결함 자동 탐지를 위해 NVIDIA Jetson TX2에서 실행되는 항공기 점검 시연기를 프로토타이핑하고 있는 空中客车

NVIDIA Jetson TX2에서 자동 결함 점검을 프로토타이핑하고 있는 空中客车公司。

지원되는툴박스및함수로부터코드생성

GPU编码器는다양하고폭넓은MATLAB언어기능을이용하여코드를생성합니다。설계엔지니어는이코드를이용해서더큰시스템의구성요소인알고리즘을개발할수있습니다。MATLAB및툴박스에는390개가넘는연산자및함수가포함되어있습니다。

지원되는툴박스및함수

MATLAB언어기능지원

코드 생성을 위한 MATLAB언어 및 툴박스 지원.

레거시코드통합

레거시 코드 통합 기능을 활용하여 신뢰할 수 있는 또는 최적화 수준이 높은 库达코드를 MATLAB알고리즘에 통합하고 테스트한 다음에, 생성된 코드에서 해당 库达코드를 호출해 보십시오.

레거시코드통합

생성된코드에기존CUDA코드를통합。

从Simulink模型生成CUDA代码金宝app

在Simulink中创建模型并生成金宝app优化的CUDA代码。

运行模拟和生成优化代码的NVIDIA gpu

当与Simulink Code金宝appr™一起使用时，GPU Coder可以加速你在NVIDIA GPU上的Simulink模型中的MATLAB函数块的计算密集型部分。然后，你可以从Simulink模型生成优化的CUDA代码，并将其部署到你的NVIDIA GPU目标。金宝app

使用GPU编码器的仿真加速

利用GPU编码器从Simulink模型生成金宝app代码

针对NVIDIA嵌入式板

金宝app在GPU上运行的Sobel边缘检测器的Simulink模型。

部署端到端深度学习算法

使用深度学习工具箱中经过培训的各种深度学习网络（包括ResNet-50、SegNet和LSTM）™ 在Simulink模型中，并部署到NVIDIA GPU。生成用于预处理和后处理的代码，以及经过培训的深度学习网络，以部署完整的算法。金宝app

金宝app支持的网络和层

利用MATLAB功能块在Simul金宝appink中进行深度学习

在Simulink中使用ResNet-50对输入图像进行分类。金宝app

日志信号，调谐参数，数字验证代码行为

当与Simulink编码器一起金宝app使用时，GPU编码器使您能够使用外部模式模拟实时记录信号和调整参数。使用嵌入式编码器和GPU编码器运行软件在环测试和处理器在环测试，以数字方式验证生成的代码与模拟行为匹配。

使用外部模式进行参数调整和信号监测

数值等价测试

使用外部模式在Simulink中记录信号并调整参数。金宝app

딥러닝네트워크에서CUDA코드생성

딥러닝툴박스를이용하여,학습된딥러닝네트워크를배포

엔드 투 엔드 딥러닝 알고리즘 배포

深度学习工具箱™에 있는 ResNet-50，SegNet등 학습된 다양한 딥러닝 네트워크를 英伟达GPU에 배포하십시오. 학습된 딥러닝 네트워크 이외에도, 전처리나 후처리에 사용되는 코드를 생성하여 전체 알고리즘을 배포하십시오.

지원되는네트워크와계층

GPU编码器와 约洛v2를 이용한 실시간 객체 탐지(或无)

교통 신호 감지 및 인식

시멘틱분할알고리즘을위한CUDA코드생성하기(19)

5：27

凯拉斯张量流모델을 위한 库达코드를 생성하는 방법

SegNet을비롯한학습된다양한딥러닝네트워크를배포합니다。

추론을 위한 최적 코드를 생성

GPU编码器는 특정 알고리즘과 함께 추론을 실행하는 데 필요한 코드만 생성하기 때문에, 다른 딥러닝 솔루션에 비해 생성되는 코드가 작습니다. 생성된 코드는 坦索特™, cuDNN을 비롯한 최적화된 라이브러리를 호출합니다.

GPU编码器이용하여 최적화한 차선 감지

CuDNN을 이용하여 泰坦V GPU에서 VGG-16으로 단일 이미지 추론.

坦索特를 이용한 최적화

고성능딥러닝추론옵티마이저이며런타임라이브러리인NVIDIA TensorRT와통합하는코드를생성합니다。INT8또는FP16데이터형을이용하여,표준FP32데이터형에비해성능을한층업그레이드합니다。

TensorRT를이용하여NVIDIA GPU에서보행자탐지하기(1:34)

英伟达TensorRT를이용한딥러닝예측

MATLAB，GPU编码器，TensorRT를 이용하여 捷森AGX Xavier에서 이루어지는 딥러닝(24:40)

NVIDIA GPU에MATLAB및TensorRT사용

坦索特와 INT8데이터형을 이용한 실행 속도 개선

딥러닝양자화

模型量化图书馆지원패키지를사용하여딥러닝신경망을INT8로양자화하고선택한계층의가중치와편향을양자화한결과에대한정확도의절충관계를분석할수있습니다。

심층신경망양자화기로INT8양자화하기

심층 신경망의 양자화

int8양자화란무엇이며심층신경망에int8양자화가인기있는이유는?

2:50

MATLAB에서 딥러닝 네트워크 수량화

하드웨어에서프로토타이핑

알고리즘을자동으로CUDA코드로변환시켜서하드웨어속도를높이십시오。

英伟达杰森및驱动플랫폼에대한프로토타이핑

GPU编码器™의NVIDIA^®GPU지원 패키지를 활용하여, 생성된 코드를 자동으로 英伟达捷森酒店™ 및 驱力™ 플랫폼에 크로스 컴파일링하고 배포하십시오.

GPU编码器의NVIDIA Tegra지원

GPU编码器의 英伟达大道지원

GPU编码器를이용한NVIDIA驱动,杰森에대한프로토타이핑과배포(2:54)

NVIDIA驱动에서이루어지는시멘틱분할

英伟达杰森플랫폼으로의프로토타이핑。

MATLAB및 생성된 코드로부터 주변기기와 센서에 액세스

MATLAB으로부터 英伟达타겟과 원격 통신을 하여, 웹캠과 기타 지원 주변기기에서 데이터를 획득하여 빠르게 프로토타이핑을 하십시오. 단독 실행을 위해 보드에 제공하는 주변기기 인터페이스 코드와 함께 알고리즘을 구축하고 배포하십시오.

英伟达捷森酒店에 있는 웹캠을 이용한 소벨 경계 탐지

웹캠 이미지를 NVIDIA Jetson TX2플랫폼에 배포하고 분류

MATLAB및생성된코드로부터주변기기와센서에액세스。

프로토타이핑에서시스템양산으로이동

GPU编码器와 嵌入式编码器^®를이용하여,생성된CUDA코드와MATLAB코드를하나씩비교해가면서대화형으로추적하십시오。银(software-in-the-loop)및公益诉讼(processor-in-the-loop)테스팅을이용하여,하드웨어에서실행중인생성된코드의결과를확인하십시오。

MATLAB코드와생성된CUDA코드를비교해가면서추적

생성된 코드의 정확도를 확인

GPU编码器애플리케이션을 이용한 皮尔실행

皮尔의 실행 시간 프로파일링

GPU编码器와嵌入式编码器를활용한대화형추적가능성보고서。

优化生成的代码

GPU编码器自动优化生成的代码。使用设计模式进一步提高性能。

最小化CPU-GPU内存传输和优化内存使用

GPU编码器自动分析、识别和划分MATLAB代码段，以便在CPU或GPU上运行。它还最小化了CPU和GPU之间的数据拷贝数。使用分析工具识别其他潜在的瓶颈。

GPU编程范式

内核创建

GPU内存分配和最小化

生成代码的GPU执行分析

确定潜在瓶颈的概要报告。

调用优化的库

使用GPU编码器生成的代码调用优化的NVIDIA CUDA库，包括TensorRT, cuDNN, cuSolver, cuFFT, cuBLAS和Thrust。从MATLAB工具箱函数生成的代码将尽可能映射到优化的库中。

库调用的内核

NVIDIA TensorRT

NVIDIA cuDNN

NVIDIA cuFFT

在优化的Cuft CUDA库中生成代码调用函数。

使用设计模式进一步加速

模具处理等设计模式使用共享内存来提高内存带宽。当使用某些函数（如卷积）时，它们会自动应用。您还可以使用特定的pragma手动调用它们。

设计模式

图形处理器上的模板处理

模具加工设计图案。

알고리즘 가속화

库达코드를 생성하고 컴파일하여 MATLAB내부에서 사용하십시오.

GPU를 이용한 알고리즘 가속화

생성된CUDA코드를MATLAB코드에서墨西哥人함수로서호출하여,실행속도를높이십시오。다만성능은MATLAB코드의내용에따라달라질수있습니다。생성된墨西哥人함수를프로파일링하여병목현상을찾아내고최적화에집중하십시오。

GPU코드생성:맨들브로트집합

생성된 코드의 GPU실행 프로파일링

GPU编码器를 사용하여 英伟达GPU상에서의 레이더 시뮬레이션 가속(3:24)

2:22

안개(雾)수정알고리즘용CUDA코드생성하기

使用NVIDIA GP金宝appU加速Simulink模拟

当与Simulink编码器一起金宝app使用时，GPU编码器可加速NVIDIA GPU上Simulink模型中MATLAB功能块的计算密集型部分。

基于GPU编码器的仿真加速

GPU编码器

英伟达GPU에 활용할 수 있는 库达코드 생성

시작하기:

무료백서:MATLAB에서CUDA코드생성

빠르고유연한CUDA코드생성

로열티 없이 알고리즘 배포

GPU编码器성공 사례

지원되는툴박스및함수로부터코드생성

레거시코드통합

从Simulink模型生成CUDA代码金宝app

运行模拟和生成优化代码的NVIDIA gpu

部署端到端深度学习算法

日志信号，调谐参数，数字验证代码行为

딥러닝네트워크에서CUDA코드생성

엔드 투 엔드 딥러닝 알고리즘 배포

추론을 위한 최적 코드를 생성

坦索特를 이용한 최적화

딥러닝양자화

하드웨어에서프로토타이핑

英伟达杰森및驱动플랫폼에대한프로토타이핑

MATLAB및 생성된 코드로부터 주변기기와 센서에 액세스

프로토타이핑에서시스템양산으로이동

优化生成的代码

最小化CPU-GPU内存传输和优化内存使用

调用优化的库

使用设计模式进一步加速

알고리즘 가속화

GPU를 이용한 알고리즘 가속화

使用NVIDIA GP金宝appU加速Simulink模拟

최신기능

金宝app仿真软件的支持金宝app

深度学习Simulink支持金宝app金宝app

持续的变量

小波工具箱代码的生成

深度学习

多输入网络

长短期记忆(LSTM)网络

NVIDIA硬件的IO块库

GPU编码器추가 리소스

GPU编码器이궁금하십니까?

무료백서:
MATLAB에서CUDA코드생성