主要内容

加固学习工具箱

使用强化学习设计和列车政策

加固学习工具箱™提供了使用加固学习算法的培训策略的功能和块,包括DQN,A2C和DDPG。您可以使用这些策略来实现用于复杂系统的控制器和决策算法,例如机器人和自主系统。您可以使用深神经网络,多项式或查找表来实施策略。

Toolbox允许您通过使它们与Matlab表示的环境进行交互来培训策略®或者模金宝app拟®楷模。您可以评估算法,使用HyperParameter设置进行实验,并监控培训进度。为了提高培训性能,您可以在云,计算机集群和GPU上并行运行模拟(并行计算工具箱™和MATLAB并行服务器™)。

通过Onnx™模型格式,可以从深度学习框架(如Tensorflow™Keras和Pytorch)导入现有策略(具有深度学习工具箱™)。您可以生成优化的C,C ++和CUDA代码,以便在微控制器和GPU上部署培训的策略。

该工具箱包括使用加强学习的参考示例,用于设计机器人和自动化驾驶应用的控制器。

开始

了解加强学习工具箱的基础知识

Matlab环境

MATLAB模型强化学习环境动态

金宝appSimulink环境

使用Simulink模型的模型强化学习环境动态金宝app

代理人

使用普通算法创建和配置强化学习代理,例如Sarsa,DQN,DDPG和A2C

政策和价值函数

定义策略和值函数表示,例如深神经网络和Q表

培训和验证

火车和模拟强化学习代理

政策部署

代码生成和培训策略部署