加固学习工具箱

Concevoir et entraîner des politiques grâce au Reinforcement Learning

强化学习工具箱™为功能和块提供entraîner强化学习算法的策略使用,告诉DQN, A2C和DDPG。你们可以使用这些政策为implémenter contrôleurs和systèmes décisionnels为systèmes的机器人和systèmes的自治综合体。你们可以看到implémenter政治和réseaux神经元深奥,polynômes,还有查找表。

在工具箱中,你们可以看到entraîner环境中渗透的政策représentés等于modèles MATLAB®ou仿金宝app真软件®.你们可以找到évaluer算法,测试者différents réglages des hyperparamètres以及学徒进程的监测者。为améliorer的性能的学徒,您可以在parallèle的云,集群和GPU (avec并行计算工具箱™和MATLAB并行服务器™)的exécuter多个模拟。

通过modèle ONNX™的格式,您可以导入政治学存在的à深度学习的环境,使用TensorFlow™Keras et PyTorch (avec深度学习工具箱™)。您可以使用générer du code optimisé C, c++和CUDA pour déployer des policy entraînées sur des microcontrôleurs des GPU。

工具箱提出了référence的例子用于强化学习在contrôleurs的concevoir中用于机器人和导管自主的应用。

EN Savoir Plus:

LES代理商杜强化学习

Implémentezdes代理Matlab et Simulin金宝appk PourEntraînerdes PolitiquesReecésentées帕特雷雷雷德神经元脆弱性。Utilisez des algorimes de CreenfillicationQuédéfinisouhandnalisés。

强化学习算法

Implémentez des agents en utilisant des algorithmes prédéfinis comme Deep Q-Network (DQN),优势演员评论家(A2C)OU深度确定性政策梯度(DDPG)。Utilisez desModèlesPleinlimentersdegentsPersalnalisésafin d'entraînerdes politiques。

这些代理人组成了一个政治和一个算法。

Représentation政治和价值函数与réseaux深奥的神经元函数相同

Utilisez desPotitiquesàSaseDeRéseauxde neurones Profonds Pour LesSystèmesCompleasesQui Contenent De Basses ExpacesÉtat-action。Definissez des Potitiques AvecdesRéseauxet des aliachtores销售De Dee Learing Toolbox。Importez desModèlesonnx浇注保证程序L'InteropérabilitéAvecd'Autres Environnements De Dee Learning。

block 金宝appSimulink pour les agents

Implémentez和entraînez的强化学习代理在Simulink。金宝app

block Reinforcement Learning Agent pour金宝app Simulink。

模式l 'environnement

Créer des modèles d ' environment在MATLAB和Simulink金宝app中。Décrivez动态的systèmes和观察的主要内容为récompense的信号为强化学习的代理人。

Simulink和Simsca金宝apppe环境

Utilisez des modèles 金宝appSimulink和Simscape™pour représenter un环境。Spécifiez观察,行动和信号récompense在modèle。

Modèled'Environnement S金宝appimulink Pour Un PenduleInversé。

环境Matlab.

利用函数和类MATLAB pour représenter un环境。Spécifiez观察,作用和récompense的变量在MATLAB中。

环境MATLAB倒摆inversé sur战车。

得l 'apprentissage

Accélérezl'appentissage avec联合国GPU,Un Cloud et des Ressources信息艺术商店。

计算distribué et accélération multicœurs

Accélérezl'appentissage en exaalcutant des simulations enparallèlesur des ordinateurs multiicueurs,des Ressources云ous clusters de Calcul Avec并行计算工具箱EtMATLAB并行服务器

Accélérer我的学徒平均计算parallèle。

GPU加速

Accélérez l ' apprentice和l 'inférence de réseaux de neurones深刻的GPU NVIDIA®高级性能。用MATLAB用并行计算工具箱et la plupart des gpu nvidia cudats cuda®钟爱一个Compuitédecall3.0 ousueérieure

Accélérersl'appentissage avec des gpu。

Générer et déployer du代码

Déployez政治entraînées在systèmes embarqués ou intégrez-les在一个巨大的éventail在systèmes生产。

一代德代码

GPU编码器™, générez du code CUDA optimisé à partir de code MATLAB représentant des politiques entraînées。Générez du code C/ c++ avecMatlab Coder™倒入DépuniperEsdes Politiques。

Générer du code CUDA avec GPU Coder。

金宝app支持MATLAB编译器

MATLAB编译器™ET.MATLAB编译器SDK™您可以使用déployer des politiques entraînées sous formme de bibliothèques partagées C/ c++, d ' assemalize Microsoft®.NET, de classes Java®et de包python®

在程序自治的情况下,打包者和参与者的政策。

ExemplesdeRéférence.

Concevez desContrôleursAvec Le Contivilition Learning Pour Des Robots,Des voitures autonomes等attressystèmes。

在知道+

Implémentez des contrôleurs basés sur le Reinforcement Learning为problèmes提供的信息是équilibrage d ' un pendule inversé,导航在problème网格世界中,维护在équilibre d ' un pendule inversé在战车中。

Résolutiond'联合国Problème网格世界。

应用于自动浇注管道

contrôleurs的Concevez为systèmes的régulation的自适应的vitesse和保持的轨迹。

appentissage d'联合国Systèmed'AUSIESAUMAINTIEN de La Trajectire。

Nouveautes

加固学习多元代理

Entraînezde倍数代理同时达斯联合国环境西班牙语金宝app

代理actor-critic软

Entraînez政治échantillonnage对环境的作用和空间的行动一起持续利用一个探索加上poussée

代理par defaut

ÉvitezLa配方Manuelle de Potitiques enCréantdeGentAvec Une SurructiondeRéseaudeneuronespardéfaut

Consultez莱斯指出de版本为我们的机智加上fonctionnalités等函数对应。

Sériedevidéossur le le钢筋学习

Cettez CetteSériedevidéosplyvousCommerieniser Avec Les Concepts De Creefilce Learnings。