强化学习工具箱

Concevez et entraînez des politiques grâce à l ' apprentice par reinforce

强化学习工具箱™为entraîner的功能和块提供策略的算法的学习执行,告诉DQN, A2C和DDPG。你们可以使用这些政策为implémenter contrôleurs和systèmes décisionnels为systèmes的机器人和systèmes的自治综合体。你们可以看到implémenter les politiques à l 'aide de réseaux neuronaux profond, de polynômes,还有查找表。

在工具箱中,你们可以看到entraîner环境中渗透的政策représentés等于modèles MATLAB®ou仿金宝app真软件®.VousPouvezévaluerLES算法,TesterDifférentsRégragesStreparamètreset surveiller la进展de l'appentissage。POUPAMÉIORERLES表演DE L'Apperentsage,Vous PouvezExécuterPliceurs模拟enParallèlesur lec云,Sur des Clusters et sur des gpu(Avec并行计算工具箱™et Matlab Parturant Server™)。

通过modèle ONNX™的格式,您可以导入政治学存在的à深度学习的环境,使用TensorFlow™Keras et PyTorch (avec深度学习工具箱™)。您可以使用générer du code optimisé C, c++和CUDA pour déployer des policy entraînées sur des microcontrôleurs des GPU。

工具箱包括référence的例子,在contrôleurs的concevoir中使用的学徒,用于机器人和导管自主的应用。

在知道加上:

当学徒的特工

Implémentez des agents MATLAB et 金宝appSimulink pour entraîner des politiques représentées par des réseaux neuronaux profonds。利用算法的学徒par执行prédéfinis或personnalisés。

算法D'appentissage parencement

Implémentezdes代理EN UTIRAST DES算法PrédéfinisCommeDeep Q-Network(DQN),优势演员评论家(A2C)ou Deep Deterministic Policy Gradients (DDPG)。utiisez des modèles pour implémenter des agents personnalisés afin d 'entraîner des politiques。

这些代理人组成了一个政治和一个算法。

Représentation政治和价值函数à辅助réseaux neuronaux profonds

Utilisez desPotitiquesàSaseDeRéseauxneuronaux Proponds Pour LesSystèmesCompleasesQui Contenent De Vaspes ExpacesÉtat-o​​cction。DéfinissezdesPolitiquesàl'AideDeRéseaux等成像销料De La Deep Learing工具箱。Importez desModèlesonnx浇注保证程序L'InteropérabilitéAvecd'Autres Environnements De Dee Learning。

block 金宝appSimulink pour les agents

Implémentez及entraînez在Simulink中执行学徒的代理人。金宝app

Bloc D'Agent D'appentissage parencement pultection 金宝apppour simulink。

Modelisation de l 'environnement

Créer des modèles d ' environment在MATLAB和Simulink金宝app中。Décrivez dynamique de systèmes,观察和signaux de récompense为学徒代理人。

Environnements 金宝appSimulink等Simscape

Utilisez des modèles 金宝appSimulink和Simscape™pour représenter un环境。Spécifiez观察,行动和信号récompense在modèle。

Modèle d ' environment 金宝appSimulink pour un pendle inversé。

MATLAB environnement)

Utilisez LES Fonctions et Les类Matlab倒入Représenter联合国环境。Spécifiezl'观察,L'Action et Les VariablesdeRécompenseDansLe Fichier Matlab。

环境MATLAB倒摆inversé sur战车。

Accélémationdel'appentissage

Accélérez l ' apprentice à l 'aide d 'un GPU, d 'un cloud and de resources informatiques distribuées。

计算distribué et accélération multicœurs

Accélérez学徒exécutant模拟parallèle sur des ordinateurs multicœurs,资源云和集群计算à辅助的并行计算工具箱等MATLAB并行服务器

Accélérez l ' apprentice à l 'aide du calculate parallèle。

GPU加速

Accélérez l ' apprentice和l 'inférence de réseaux neuronaux profonds à l 'aide des GPU NVIDIA®高级性能。用MATLAB用并行计算工具箱总之,GPU NVIDIA兼容CUDA®dotésd'fore.Capacité de微积分3.0 ou supérieure

Accélérez学徒à GPU的助手。

Génération et déploiement de code

Déployez政治entraînées在systèmes embarqués ou intégrez-les在一个巨大的éventail在systèmes生产。

一代德代码

Avec.GPU编码器™,GénérezducodeCudaOptimiséàPartirde Code MatlabReprésentantdes PotitiquesEntraînées。Générezdu Code C / C ++àl'AIDEDEMATLAB编码器™Pour déployer des politiques。

Générez du code CUDA avec de GPU Coder。

金宝app支持MATLAB编译器

MATLAB编译器™MATLAB编译器SDK™您可以使用déployer des politiques entraînées sous formme de bibliothèques partagées C/ c++, d ' assemalize Microsoft®.NET,De Classes Java®Python中的et de packages®

在程序自治的前提下,政治的Packagez和partagez。

例子参考

关于contrôleurs à的学徒助手为机器人的执行,自主和其他systèmes。

总理不是

Implémentez des contrôleurs basés在为problèmes执行的学徒中,告诉我équilibrage d ' an钟摆inversé,导航在一个problème网格世界中,而维护在équilibre d ' an钟摆inversé在一个战车上。

应用于自动浇注管道

contrôleurs的Concevez为systèmes的régulation的自适应的vitesse和保持的轨迹。

学徒système保持轨迹的助手。

Nouveautes

代理TD3.

créez des agents Deep Deterministic Policy Gradient (TD3) à double retard qui présentent souvent une vitesse d '学徒和性能supérieures à celles des agents DDPG

新代理人使行动空间持续不断

Utilisez des代理PPO,TD3,AC et PG AVEC DES EXPACES D'Action Convertus

政治LSTM

Créezdes potitiques dereéseauxneuronaux avec des reareaux LSTM(长期内存)倒LES代理DQN ET PPO

Consultez Les.Notes de版本为我们的机智加上fonctionnalités等函数对应。