加固学习工具箱
ENTWURF und培训von Richtlinien MITHILFE VON REINFILINCING学习
模具加固学习工具箱™Bietet FunktioNen undBlöckezumtrainieren von Richtlinien Mit Creefile-Learning-Algorionenen Wie DQN,A2C und DDPG。岩石迪亚尔里奇林·斯泰·斯蒂·斯蒂·斯蒂·斯蒂·斯蒂·斯托米森·斯科姆斯·斯蒂姆森·克罗姆复合体系und roboter und upotonome anlagen实施者。Bei der Simptionierung derRichtlinienKönnenIefeNeuronale Netze,Polynome Oter Lookup-Tabellen Zum Einsatz Kommen。
Die ToolboxErmöglichtDasTrainieren von Richtlinien Durch Die Interaktion Mit Umgebungen,Die Als Matlab®- oder金宝app simulink.®-Modelle Dargestellt Werden。Sie HabenDieMöglichkeit,algorithmen zu evaluieren,Mit Hyperparameter-Einstellungen Zu Explimentieren und Den RainingsfortschrittZuüberwachen。UM Die Rainingsleistung Zu Optimieren,KönnenSWardelseSimulateen在Der Cloud,Cluustern und Auf GPU(MIT der Parallic Computing Toolbox™und Matlab Parturant Server™)Ausführen。
Durch DAS Onnx™-Modellformat Lassen Sich Vorhandene Richtlinien Aus Deey-Learning-Frameworks Wie Tensorflow™Keras und Pytorch(MIT DER DEAD学习工具箱™)Importieren。SieKönnenOptimieren C-,C ++ - und Cuda-Code Generieren,UM Trainierte Richtlinien AUF MicroControllern und GPUS Anzuwenden。
Die Toolbox BeinhaltetReamenispieleFürdeneinsatzvon加固学习zum entwerfen von Steerungenfürcobotiksystemeund anwendungenfür自动化isiertes fahren。
现在beginnen:
强化学习算法
深度Q-Network (DQN)的实施者,优势演员评论家(A2C),深度确定性政策梯度(DDPG)und Anderen Integrierten算法。Verwenden Sie Vorlagen,Um Benutzerdefinierte Agenten Zum Trainieren von Richtlinien Zu Implientieren。
Darstellung von Richtlinien und Wertefunktionen Mithilfe Wijifer Neuronaler Netze
Verwenden Sie tiefe neuronale Netze für Richtlinien komplexer Systeme mit groen zstands -/Handlungsräumen。您可以使用Netzen和Architekturen的深度学习工具箱。请您访问我们的网站Interoperabilität mit anderen Deep-Learning-Frameworks。
金宝appSimulink-Blöckefüragenten
Implientieren und Trainerenieren Sie Contivemation-Agenten在Simulink中金宝app。
金宝appSimulink- und Simscape-Umgebungen
Verwenden Sie 金宝appSimulink- und Simscape™- modelle für die Darstellung einer Umgebung。您的手和肺都是型号内的信号。
MATLAB-Umgebungen
Verwenden Sie Matlab-Funktionen Und-KlassenFürieDarstellungEiner Umgebung。Bestimmen Sie Beobachtungs-,Handlungs-und Belohnungsvariablen Innerhalb der Matlab-datei。
维提尔斯和梅尔克恩
Beschleunigen Sie Das训练,Indem Sie Parstale Simulationen Auf Mehrkerncomputern,云-Ressourcen Oter Computerclustern Mithilfe der并行计算工具箱UNDMATLAB并行服务器Durchführen。
gpu-beschleunigung
请您在NVIDIA进行训练和神经系统测试®-GPUS。verwenden sie matlab mit der并行计算工具箱然后我听CUDA®-fähigennvidia-gpus mitCUDA-Version 3.0订购höher。
Codegenerierung
Verwenden Sie Den.GPU编码器™,UM Optimieren Cuda-Code Aus Matlab-Code Zu Generieren,Der Die Richtlinien Nach DEM培训Wiedergibt。Verwenden Sie Den.Matlab Coder™,UM C- / C ++ - 代码FürIeBereitStellungvon Richtlinien Zu Generieren。
Unterstützungfürmatlab编译器
Verwenden SieMatlab Compiler™und.MATLAB编译器SDK™,嗯Richtlinien nach dem Training C/ c++ freigegebene Bibliotheken, Microsoft®.NET - 程序集,Java®-klassen und python.®-pakete bereitzustelen。
Einstieg.
实施者您可以在强化学习中使用Steuerungen für问题是Ausgleich eines inverspenels, die Navigation in Grid-World-Labyrinth and den Ausgleich eines Wagen-Pendel-Systems。
anwendungenfür自动化isiertes fahren
Entwerfen Sie SteerungenFür适应性Tempomaten und Spurhalteassistenten。
robotik.
Entwerfen Sie mithilfe von Reinforcement Learning Steuerungen für Roboter。
强化学习视频系列
观看这个系列的视频来学习更多关于强化学习的知识。