文件帮助中心

加固学习工具箱

使用强化学习设计和列车政策

加固学习工具箱™提供了使用加固学习算法的培训策略的功能和块，包括DQN，A2C和DDPG。您可以使用这些策略来实现用于复杂系统的控制器和决策算法，例如机器人和自主系统。您可以使用深神经网络，多项式或查找表来实施策略。

Toolbox允许您通过使它们与Matlab表示的环境进行交互来培训策略^®或者模金宝app拟^®楷模。您可以评估算法，使用HyperParameter设置进行实验，并监控培训进度。为了提高培训性能，您可以在云，计算机集群和GPU上并行运行模拟（并行计算工具箱™和MATLAB并行服务器™）。

通过Onnx™模型格式，可以从深度学习框架（如Tensorflow™Keras和Pytorch）导入现有策略（具有深度学习工具箱™）。您可以生成优化的C，C ++和CUDA代码，以便在微控制器和GPU上部署培训的策略。

该工具箱包括使用加强学习的参考示例，用于设计机器人和自动化驾驶应用的控制器。

开始

了解加强学习工具箱的基础知识

Matlab环境

MATLAB模型强化学习环境动态

金宝appSimulink环境

使用Simulink模型的模型强化学习环境动态金宝app

代理人

使用普通算法创建和配置强化学习代理，例如Sarsa，DQN，DDPG和A2C

政策和价值函数

定义策略和值函数表示，例如深神经网络和Q表

培训和验证

火车和模拟强化学习代理

政策部署

代码生成和培训策略部署

强化学习工具箱文档

金宝app

尝试matlab，sim金宝appulink等产品下载188bet金宝搏

立即获得试用