强化学习工具箱
Concevez et entraînez des politiques grâce à l ' apprentice par reinforce
强化学习工具箱™为entraîner的功能和块提供策略的算法的学习执行,告诉DQN, A2C和DDPG。你们可以使用这些政策为implémenter contrôleurs和systèmes décisionnels为systèmes的机器人和systèmes的自治综合体。你们可以看到implémenter les politiques à l 'aide de réseaux neuronaux profond, de polynômes,还有查找表。
在工具箱中,你们可以看到entraîner环境中渗透的政策représentés等于modèles MATLAB®ou仿金宝app真软件®.VousPouvezévaluerLES算法,TesterDifférentsRégragesStreparamètreset surveiller la进展de l'appentissage。POUPAMÉIORERLES表演DE L'Apperentsage,Vous PouvezExécuterPliceurs模拟enParallèlesur lec云,Sur des Clusters et sur des gpu(Avec并行计算工具箱™et Matlab Parturant Server™)。
通过modèle ONNX™的格式,您可以导入政治学存在的à深度学习的环境,使用TensorFlow™Keras et PyTorch (avec深度学习工具箱™)。您可以使用générer du code optimisé C, c++和CUDA pour déployer des policy entraînées sur des microcontrôleurs des GPU。
工具箱包括référence的例子,在contrôleurs的concevoir中使用的学徒,用于机器人和导管自主的应用。
在知道加上:
算法D'appentissage parencement
Implémentezdes代理EN UTIRAST DES算法PrédéfinisCommeDeep Q-Network(DQN),优势演员评论家(A2C)ou Deep Deterministic Policy Gradients (DDPG)。utiisez des modèles pour implémenter des agents personnalisés afin d 'entraîner des politiques。
Représentation政治和价值函数à辅助réseaux neuronaux profonds
Utilisez desPotitiquesàSaseDeRéseauxneuronaux Proponds Pour LesSystèmesCompleasesQui Contenent De Vaspes ExpacesÉtat-ocction。DéfinissezdesPolitiquesàl'AideDeRéseaux等成像销料De La Deep Learing工具箱。Importez desModèlesonnx浇注保证程序L'InteropérabilitéAvecd'Autres Environnements De Dee Learning。
block 金宝appSimulink pour les agents
Implémentez及entraînez在Simulink中执行学徒的代理人。金宝app
Environnements 金宝appSimulink等Simscape
Utilisez des modèles 金宝appSimulink和Simscape™pour représenter un环境。Spécifiez观察,行动和信号récompense在modèle。
MATLAB environnement)
Utilisez LES Fonctions et Les类Matlab倒入Représenter联合国环境。Spécifiezl'观察,L'Action et Les VariablesdeRécompenseDansLe Fichier Matlab。
计算distribué et accélération multicœurs
Accélérez学徒exécutant模拟parallèle sur des ordinateurs multicœurs,资源云和集群计算à辅助的并行计算工具箱等MATLAB并行服务器.
GPU加速
Accélérez l ' apprentice和l 'inférence de réseaux neuronaux profonds à l 'aide des GPU NVIDIA®高级性能。用MATLAB用并行计算工具箱总之,GPU NVIDIA兼容CUDA®dotésd'fore.Capacité de微积分3.0 ou supérieure.
一代德代码
Avec.GPU编码器™,GénérezducodeCudaOptimiséàPartirde Code MatlabReprésentantdes PotitiquesEntraînées。Générezdu Code C / C ++àl'AIDEDEMATLAB编码器™Pour déployer des politiques。
金宝app支持MATLAB编译器
MATLAB编译器™等MATLAB编译器SDK™您可以使用déployer des politiques entraînées sous formme de bibliothèques partagées C/ c++, d ' assemalize Microsoft®.NET,De Classes Java®Python中的et de packages®.
总理不是
Implémentez des contrôleurs basés在为problèmes执行的学徒中,告诉我équilibrage d ' an钟摆inversé,导航在一个problème网格世界中,而维护在équilibre d ' an钟摆inversé在一个战车上。
应用于自动浇注管道
contrôleurs的Concevez为systèmes的régulation的自适应的vitesse和保持的轨迹。
机器人
Concevez desContrôleurs倒了机器人Grâceàl'sperentissageparencement。
代理TD3.
créez des agents Deep Deterministic Policy Gradient (TD3) à double retard qui présentent souvent une vitesse d '学徒和性能supérieures à celles des agents DDPG
新代理人使行动空间持续不断
Utilisez des代理PPO,TD3,AC et PG AVEC DES EXPACES D'Action Convertus
政治LSTM
Créezdes potitiques dereéseauxneuronaux avec des reareaux LSTM(长期内存)倒LES代理DQN ET PPO
Consultez Les.Notes de版本为我们的机智加上fonctionnalités等函数对应。