GPU编码器

GPU编码器

Génération de code CUDA pour des GPU NVIDIA

En savoir加:

Génération代码CUDA rapide et灵活

Générez du代码CUDA optimisé。Déployez du权利自由代码。

Déploiement d'algorithmes liberres de droits

Compilez et exécutez votre code généré sur des GPU NVIDIA courants depuis un PC, sur des数据中心ou du硬件embarqué。代码généré est libre de droits, vous pouvez donc Le déployer gratuitement dans des application commerciales pour vos clients。

画廊的Voir la galerie(2图)

Les原型空客ont automatisé la détection de défauts sur NVIDIA Jetson TX2。

Les原型空客ont automatisé la détection de défauts sur NVIDIA Jetson TX2。

Génération de代码à partir des工具箱等函数supportées金宝app

GPU Coder génère du code à partr d’un large éventail de fonctionnalités du language MATLAB que les ingénieurs de design utilent pour développer des algorithmes en tant que composants de systèmes plus important。Ceci包括des centaines d'opérateurs等函数MATLAB ainsi que leurs工具箱associées。

金宝app支持du语言et des工具箱MATLAB倒la génération de代码。

金宝app支持du语言et des工具箱MATLAB倒la génération de代码。

合并代码存在

Utilisez les fonctionnalités d'intégration de code existant pour incorporer du code CUDA fiable ou hautement optimisé dans vos算法MATLAB pour les tester dans MATLAB。Appelez ensuite ce même code CUDA à partir du code généré。

合并du代码CUDA存在dans du代码généré。

合并du代码CUDA存在dans du代码généré。

Génération de code CUDA à partir de modèles 金宝appSimulink

Créez des modèles dans 金宝appSimulink et générez du code CUDA optimisé。

Exécuter des模拟et générer du代码optimisé倒les GPU NVIDIA

Lorsqu'il est utilisé avec 金宝appSimulink Coder™,GPU Coder accélère les parties des blocs MATLAB Function qui exigent des calculus intensifs dans vos modèles Simulink sur des GPU NVIDIA。Vous pouvez ensuite générer du code CUDA optimisé à partir du modèle 金宝appSimulink et le déployer sur votre GPU NVIDIA cible。

Modèle 金宝appSimulink d'un détecteur de contour Sobel exécuté sur un GPU。

Modèle 金宝appSimulink d'un détecteur de contour Sobel exécuté sur un GPU。

Déploiement d'algorithmes de Deep Learning de bout en bout

Utilisez de nombreux réseaux de Deep Learning entraînés (notamment ResNet-50, SegNet et LSTM) à partir de la Deep Learning Toolbox™dans votre modèle S金宝appimulink et déployez-les sur des GPU NVIDIA。Générez du code pour le prétraitement et post-traitement en parallèle avec vos réseaux de深度学习entrainés afin de déployer des算法完成。

登记de signaux, réglage de paramètres et vérification numérique du运输du代码

Utilisé avec 金宝appSimulink Coder, GPU Coder vous permet d' enregister des signaux et de régler des paramètres en temps réel à l'aide de simulations en mode externe。Utilisez嵌入式Coder avec GPU Coder pour exécuter des测试SIL(软件在环中)等PIL(处理器在环中)qui vérifient numériquement que le code généré对应au comement de la仿真。

Génération de code CUDA à partir de réseaux de深度学习

Déployez des réseaux de深度学习entraînés à l'aide de深度学习工具箱。

Déployer des algorithmes de Deep Learning de bout en bout

Déployez de nombreux réseaux de Deep Learning entraînés (notamment ResNet-50, SegNet et LSTM) à partir de la Deep Learning Toolbox™sur des GPU NVIDIA。Utilisez des couches de Deep Learning prédéfinies ou définissez des couches personnalisées pour votre application spécifique。Générez du code de prétraitement et de post- tritement en parallèle avec vos réseaux de Deep Learning afin de déployer des算法完成。

Générer du code optimisé pour l'inférence

GPU Coder génère du code avec une empreinte réduite par rapport aux autres 金宝搏官方网站solutions de Deep Learning, car il ne génère que le code nécessaire pour exécuter l'inférence avec votre algorithm spécifique。Le code généré applle des bibliothèques optimisées, notnottensorrt和cuDNN。

Inférence d'une图像唯一avec VGG-16 sur un GPU Titan V à l'aide de cuDNN。

Inférence d'une图像唯一avec VGG-16 sur un GPU Titan V à l'aide de cuDNN。

优化poussée avec TensorRT

Générez du code s'intégrant à NVIDIA TensorRT, un outil高级性能倒l'优化等'exécution d'inférences de深度学习。Utilisez des données de类型INT8 ou FP16 pour obtenir de meilleures性能qu'avec le type de données FP32。

Amélioration de la vitesse d'exécution avec des données de types TensorRT et INT8。

Amélioration de la vitesse d'exécution avec des données de types TensorRT et INT8。

优化du代码généré

GPU编码器优化自动化代码généré。Utilisez des设计模式倒améliorer encore davantage les表演。

Réduction des转移入口les mémoires du CPU et du GPU et优化de l' utilization de la mémoire

GPU编码器分析,识别和分区自动化片段解码MATLAB à exécuter在CPU和GPU上。Il minimalise également le nombre de copies de données entre le CPU et le GPU。Utilisez des outils de profile pour identifier les autres goulots d'étranglement可能。

Rapports de profile identitles goulots d'étranglements可能。

Rapports de profile identitles goulots d'étranglements可能。

调用bibliothèques optimisées

Le code généré avec GPU Coder fait appel aux bibliothèques CUDA de NVIDIA optimisées, notnottensorrt, cuDNN, cuSolver, cuFFT, cuBLAS, et Thrust。Le code généré à partir des functions issues de toolbox MATLAB est mappé sur des libraries optimisées, dans la mesure du possible。

代码généré上诉des函数丹斯拉bibliothèque cuFFT CUDA optimisée。

代码généré上诉des函数丹斯拉bibliothèque cuFFT CUDA optimisée。

利用设计模式倒une accélération加上poussée

Les设计模式de类型模板实用une mémoire partagée pour améliorer la bande passante mémoire。Ils sont appliqués自动性lorsque vous utilisez某些函数告诉que la卷积。你的权利également我们的行为方式spécifiques。

乐设计模式de型模板。

乐设计模式de型模板。

基于硬件的原型

Implémentez votre算法快速基于硬件grâce à la转换自动代码CUDA。

原型基于NVIDIA Jetson et DRIVE平台

自动编译croisée et le déploiement du code généré sur les platformes NVIDIA Jetson et DRIVE à l'aide du support package pour les金宝app GPU NVIDIA de GPU Coder。

NVIDIA Jetson平台上的原型。

NVIDIA Jetson平台上的原型。

Accès aux périphériques et aux capurs depuis MATLAB et le code généré

通讯à距离avec la cible NVIDIA代理MATLAB倒收集器les données de webcams et d' aures périphériques supportés倒un原型dès le début du cycle 金宝appde développement。Déployez选民算法en parallèle du代码d'interface périphérique sur la carte pour une exécution自治。

Accès aux périphériques et aux capurs depuis MATLAB et le code généré。

Accès aux périphériques et aux capurs depuis MATLAB et le code généré。

杜原型à拉制作

Utilisez GPU Coder avec嵌入式Coder pour effectuer un suivi interactif de votre代码MATLAB à côté du code CUDA généré。Vérifiez le组件numérique du代码généré exécuté基于硬件avec des测试SIL(软件在环)et PIL(处理器在环)。

Rapport de traçabilité interactif à l'aide de GPU Coder et d'Embedded Coder。

Rapport de traçabilité interactif à l'aide de GPU Coder et d'Embedded Coder。

Accélérer les算法

Générez du code CUDA et compilez-le pour l'utiliser dans MATLAB et 金宝appSimulink。

Accélération d'algorithmes avec des GPU dans MATLAB

applelez le代码CUDA généré sous formme de function MEX depuis votre代码MATLAB pour accélérer son exécution。Les性能observées dépendront de la nature de votre代码MATLAB。Profilez les functions MEX générées pour identifier les goulot d'étranglement et ainsi cibler vos effort d'optimisation。

Accélération de simulation S金宝appimulink avec les GPU NVIDIA

Lorsqu'il est utilisé avec 金宝appSimulink Coder, GPU Coder accélère les parties des blocs MATLAB Function qui exigent des calculus intensifs dans vos modèles Simulink sur des GPU NVIDIA。