GPU Coder™génère du code CUDA®optimisé à partir de代码MATLAB®et de modèles 金宝appSimulink®.Le code généré包括des noyaux CUDA pour les sections parallélisables de vos算法de Deep Learning, de vision embarquée et de traitement du signal。Pour une performance élevée, le code généré appelle des bibliothèques NVIDIA®CUDA optimisées,公告TensorRT™,cuDNN, cuFFT, cuSolver et cuBLAS。Le code peut être intégré dans votre projet sous formme de code source, de bibliothèques statiques ou dynamiques, et peut être compilé pour des台式机,des服务器et des GPU embarqués sur des plateformes NVIDIA Jetson™,NVIDIA DRIVE™ou autre。Vous pouvez utiliser le code CUDA généré dans MATLAB afin d'accélérer les réseaux de深度学习et d' aures parties de votre算法qui exigent des computation intensifs。Avec GPU Coder, vous pouvez intégrer à vos算法等au代码généré du代码CUDA écrit à la main。
Lorsque vous l'utilisez avec嵌入式编码器®, GPU Coder vous permet également de vérifier le comement numérique du code généré en réalisant des测试SIL(软件在环)等PIL(处理器在环)。
En savoir加:
Déploiement d'algorithmes liberres de droits
Compilez et exécutez votre code généré sur des GPU NVIDIA courants depuis un PC, sur des数据中心ou du硬件embarqué。代码généré est libre de droits, vous pouvez donc Le déployer gratuitement dans des application commerciales pour vos clients。
Témoignages客户端基于GPU Coder
Découvrez comment les ingénieurs et scientifiques de différentes industries utilent GPU Coder pour générer du code CUDA pour leurs应用程序。
Génération de代码à partir des工具箱等函数supportées金宝app
GPU Coder génère du code à partr d’un large éventail de fonctionnalités du language MATLAB que les ingénieurs de design utilent pour développer des algorithmes en tant que composants de systèmes plus important。Ceci包括des centaines d'opérateurs等函数MATLAB ainsi que leurs工具箱associées。
合并代码存在
Utilisez les fonctionnalités d'intégration de code existant pour incorporer du code CUDA fiable ou hautement optimisé dans vos算法MATLAB pour les tester dans MATLAB。Appelez ensuite ce même code CUDA à partir du code généré。
Exécuter des模拟et générer du代码optimisé倒les GPU NVIDIA
Lorsqu'il est utilisé avec 金宝appSimulink Coder™,GPU Coder accélère les parties des blocs MATLAB Function qui exigent des calculus intensifs dans vos modèles Simulink sur des GPU NVIDIA。Vous pouvez ensuite générer du code CUDA optimisé à partir du modèle 金宝appSimulink et le déployer sur votre GPU NVIDIA cible。
Déploiement d'algorithmes de Deep Learning de bout en bout
Utilisez de nombreux réseaux de Deep Learning entraînés (notamment ResNet-50, SegNet et LSTM) à partir de la Deep Learning Toolbox™dans votre modèle S金宝appimulink et déployez-les sur des GPU NVIDIA。Générez du code pour le prétraitement et post-traitement en parallèle avec vos réseaux de深度学习entrainés afin de déployer des算法完成。
登记de signaux, réglage de paramètres et vérification numérique du运输du代码
Utilisé avec 金宝appSimulink Coder, GPU Coder vous permet d' enregister des signaux et de régler des paramètres en temps réel à l'aide de simulations en mode externe。Utilisez嵌入式Coder avec GPU Coder pour exécuter des测试SIL(软件在环中)等PIL(处理器在环中)qui vérifient numériquement que le code généré对应au comement de la仿真。
Déployer des algorithmes de Deep Learning de bout en bout
Déployez de nombreux réseaux de Deep Learning entraînés (notamment ResNet-50, SegNet et LSTM) à partir de la Deep Learning Toolbox™sur des GPU NVIDIA。Utilisez des couches de Deep Learning prédéfinies ou définissez des couches personnalisées pour votre application spécifique。Générez du code de prétraitement et de post- tritement en parallèle avec vos réseaux de Deep Learning afin de déployer des算法完成。
Générer du code optimisé pour l'inférence
GPU Coder génère du code avec une empreinte réduite par rapport aux autres 金宝搏官方网站solutions de Deep Learning, car il ne génère que le code nécessaire pour exécuter l'inférence avec votre algorithm spécifique。Le code généré applle des bibliothèques optimisées, notnottensorrt和cuDNN。
优化poussée avec TensorRT
Générez du code s'intégrant à NVIDIA TensorRT, un outil高级性能倒l'优化等'exécution d'inférences de深度学习。Utilisez des données de类型INT8 ou FP16 pour obtenir de meilleures性能qu'avec le type de données FP32。
深度学习量化
Quantifiez votre réseau de深度学习pour réduire l'utilisation de la mémoire et améliorer les performance des inférences。分析et visualisez les折衷entre les性能optimisées et la précision des inférences avec l'application深度网络量化器。
Réduction des转移入口les mémoires du CPU et du GPU et优化de l' utilization de la mémoire
GPU编码器分析,识别和分区自动化片段解码MATLAB à exécuter在CPU和GPU上。Il minimalise également le nombre de copies de données entre le CPU et le GPU。Utilisez des outils de profile pour identifier les autres goulots d'étranglement可能。
调用bibliothèques optimisées
Le code généré avec GPU Coder fait appel aux bibliothèques CUDA de NVIDIA optimisées, notnottensorrt, cuDNN, cuSolver, cuFFT, cuBLAS, et Thrust。Le code généré à partir des functions issues de toolbox MATLAB est mappé sur des libraries optimisées, dans la mesure du possible。
原型基于NVIDIA Jetson et DRIVE平台
自动编译croisée et le déploiement du code généré sur les platformes NVIDIA Jetson et DRIVE à l'aide du support package pour les金宝app GPU NVIDIA de GPU Coder。
Accès aux périphériques et aux capurs depuis MATLAB et le code généré
通讯à距离avec la cible NVIDIA代理MATLAB倒收集器les données de webcams et d' aures périphériques supportés倒un原型dès le début du cycle 金宝appde développement。Déployez选民算法en parallèle du代码d'interface périphérique sur la carte pour une exécution自治。
杜原型à拉制作
Utilisez GPU Coder avec嵌入式Coder pour effectuer un suivi interactif de votre代码MATLAB à côté du code CUDA généré。Vérifiez le组件numérique du代码généré exécuté基于硬件avec des测试SIL(软件在环)et PIL(处理器在环)。
Accélération d'algorithmes avec des GPU dans MATLAB
applelez le代码CUDA généré sous formme de function MEX depuis votre代码MATLAB pour accélérer son exécution。Les性能observées dépendront de la nature de votre代码MATLAB。Profilez les functions MEX générées pour identifier les goulot d'étranglement et ainsi cibler vos effort d'optimisation。
Accélération de simulation S金宝appimulink avec les GPU NVIDIA
Lorsqu'il est utilisé avec 金宝appSimulink Coder, GPU Coder accélère les parties des blocs MATLAB Function qui exigent des calculus intensifs dans vos modèles Simulink sur des GPU NVIDIA。