GPU编码器
英伟达GPU에 활용할 수 있는 库达코드 생성
GPU编码器를사용하면MATLAB코드로부터최적화된CUDA코드를생성하여딥러닝,임베디드비,전자율시스템에활용할수있습니다。생성된코드는최적화NVIDIA CUDA라이브러리를호출하고,프로젝트에소스코드,정적라이브러리또는동적라이브러리로써통합시킬수있으며,NVIDIA Tesla나NVIDIA Tegra와같은GPU에프로토타이핑하는데사용할수있습니다。MATLAB내에서생성된CUDA를사용하여MATLAB코드에서계산집약적인부분을가속화할수있습니다。GPU编码器를이용하면MATLAB알고리즘과생성된코드에기존의CUDA코드를통합시킬수있습니다。
GPU编码器를 嵌入式编码器®와함께사용하여SIL (software-in-the-loop)테스팅을통해,생성된코드의결과를검증할수있습니다。
시작하기:
로열티 없이 알고리즘 배포
코드를생성하고컴파일하여데스크탑시스템,데이터센터,임베디드하드웨어등에널리사용되는NVIDIA GPU에서실행하십시오。생성된코드는로열티가없습니다。상용응용프로그램에서고객에게무료로배포할수있습니다。
GPU编码器성공 사례
다양한 업계에 종사하는 엔지니어와 과학자가 어떻게 GPU编码器를 이용하여 응용 프로그램용 库达코드를 생성하는지 살펴보십시오.
지원되는툴박스및함수로부터코드생성
GPU编码器는다양하고폭넓은MATLAB언어기능을이용하여코드를생성합니다。설계엔지니어는이코드를이용해서더큰시스템의구성요소인알고리즘을개발할수있습니다。MATLAB및툴박스에는390개가넘는연산자및함수가포함되어있습니다。
레거시코드통합
레거시 코드 통합 기능을 활용하여 신뢰할 수 있는 또는 최적화 수준이 높은 库达코드를 MATLAB알고리즘에 통합하고 테스트한 다음에, 생성된 코드에서 해당 库达코드를 호출해 보십시오.
运行模拟和生成优化代码的NVIDIA gpu
当与Simulink Code金宝appr™一起使用时,GPU Coder可以加速你在NVIDIA GPU上的Simulink模型中的MATLAB函数块的计算密集型部分。然后,你可以从Simulink模型生成优化的CUDA代码,并将其部署到你的NVIDIA GPU目标。金宝app
部署端到端深度学习算法
使用深度学习工具箱中经过培训的各种深度学习网络(包括ResNet-50、SegNet和LSTM)™ 在Simulink模型中,并部署到NVIDIA GPU。生成用于预处理和后处理的代码,以及经过培训的深度学习网络,以部署完整的算法。金宝app
日志信号,调谐参数,数字验证代码行为
当与Simulink编码器一起金宝app使用时,GPU编码器使您能够使用外部模式模拟实时记录信号和调整参数。使用嵌入式编码器和GPU编码器运行软件在环测试和处理器在环测试,以数字方式验证生成的代码与模拟行为匹配。
엔드 투 엔드 딥러닝 알고리즘 배포
深度学习工具箱™에 있는 ResNet-50,SegNet등 학습된 다양한 딥러닝 네트워크를 英伟达GPU에 배포하십시오. 학습된 딥러닝 네트워크 이외에도, 전처리나 후처리에 사용되는 코드를 생성하여 전체 알고리즘을 배포하십시오.
추론을 위한 최적 코드를 생성
GPU编码器는 특정 알고리즘과 함께 추론을 실행하는 데 필요한 코드만 생성하기 때문에, 다른 딥러닝 솔루션에 비해 생성되는 코드가 작습니다. 생성된 코드는 坦索特™, cuDNN을 비롯한 최적화된 라이브러리를 호출합니다.
坦索特를 이용한 최적화
고성능딥러닝추론옵티마이저이며런타임라이브러리인NVIDIA TensorRT와통합하는코드를생성합니다。INT8또는FP16데이터형을이용하여,표준FP32데이터형에비해성능을한층업그레이드합니다。
딥러닝양자화
模型量化图书馆지원패키지를사용하여딥러닝신경망을INT8로양자화하고선택한계층의가중치와편향을양자화한결과에대한정확도의절충관계를분석할수있습니다。
英伟达杰森및驱动플랫폼에대한프로토타이핑
GPU编码器™의NVIDIA®GPU지원 패키지를 활용하여, 생성된 코드를 자동으로 英伟达捷森酒店™ 및 驱力™ 플랫폼에 크로스 컴파일링하고 배포하십시오.
MATLAB및 생성된 코드로부터 주변기기와 센서에 액세스
MATLAB으로부터 英伟达타겟과 원격 통신을 하여, 웹캠과 기타 지원 주변기기에서 데이터를 획득하여 빠르게 프로토타이핑을 하십시오. 단독 실행을 위해 보드에 제공하는 주변기기 인터페이스 코드와 함께 알고리즘을 구축하고 배포하십시오.
프로토타이핑에서시스템양산으로이동
GPU编码器와 嵌入式编码器®를이용하여,생성된CUDA코드와MATLAB코드를하나씩비교해가면서대화형으로추적하십시오。银(software-in-the-loop)및公益诉讼(processor-in-the-loop)테스팅을이용하여,하드웨어에서실행중인생성된코드의결과를확인하십시오。
最小化CPU-GPU内存传输和优化内存使用
GPU编码器自动分析、识别和划分MATLAB代码段,以便在CPU或GPU上运行。它还最小化了CPU和GPU之间的数据拷贝数。使用分析工具识别其他潜在的瓶颈。
调用优化的库
使用GPU编码器生成的代码调用优化的NVIDIA CUDA库,包括TensorRT, cuDNN, cuSolver, cuFFT, cuBLAS和Thrust。从MATLAB工具箱函数生成的代码将尽可能映射到优化的库中。
GPU를 이용한 알고리즘 가속화
생성된CUDA코드를MATLAB코드에서墨西哥人함수로서호출하여,실행속도를높이십시오。다만성능은MATLAB코드의내용에따라달라질수있습니다。생성된墨西哥人함수를프로파일링하여병목현상을찾아내고최적화에집중하십시오。
使用NVIDIA GP金宝appU加速Simulink模拟
当与Simulink编码器一起金宝app使用时,GPU编码器可加速NVIDIA GPU上Simulink模型中MATLAB功能块的计算密集型部分。
金宝app仿真软件的支持金宝app
生成,构建和部署Simulink模型到NVIDIA gp金宝appu
深度学习Simulink支持金宝app金宝app
在Simulink模型中生成、构建和部署深度学习网络到NVIDIA gpu金宝app
持续的变量
在GPU上创建持久内存
小波工具箱代码的生成
使用dwt, dwt2, modwt和modwtmra生成基于fft的FIR滤波和短时间傅里叶变换的代码
深度学习
为自定义层生成代码
多输入网络
为有多个输入的网络生成代码
长短期记忆(LSTM)网络
生成卷积LSTM和网络激活的代码
NVIDIA硬件的IO块库
使用NVIDIA GPU的GPU编码器支持包访问NVIDIA硬件外设金宝app
看到发布说明有关这些功能和相应功能的详细信息。