什么是强化学习工具箱?

Emmanouil Tzorakoleftherakis, MathWorks

钢筋学习工具箱™提供MATLAB^®函数和模拟链接金宝app^®使用DQN、A2C、DDPG等强化学习算法训练策略的模块。工具箱可以为机器人、自动驾驶汽车等复杂应用实现控制器和决策系统。

您可以使用深神经网络，多项式或查找表代表策略和价值函数。通过启用强化学习代理与Matlab或Simulink中创建的环境进行交互来培训策略。金宝app评估内置和自定义算法，使用HyperParameter设置进行实验，并监控培训进度。通过并行化模拟和计算对多核CPU，GPU，计算机集群和云资源（使用并行计算工具箱™和MATLABPLILLANT SELVER™）来加速培训。

您可以通过ONNX模型格式(使用深度学习工具箱™)从TensorFlow™Keras和PyTorch等深度学习框架中导入现有策略。生成优化的C、c++和CUDA代码，在嵌入式平台上部署训练有素的策略。工具箱包括使用强化学习设计机器人和自动驾驶应用控制器的参考例子。

Reinforcement Learning Toolbox提供了一些函数和模块，让你为机器人和自动驾驶汽车等自动系统实现控制器和决策算法。

工具箱使您可以通过MATLAB和Simulink创建生长学习工作流程的所有步骤，从创建环境和代理到策略培训和部署。金宝app

使用深度网络设计器或通过编程方式使用内置函数创建深度神经网络策略和值函数。

除神经网络外，还支持多项式和查找表。金宝app

通过将策略与内置培训算法组合，例如演员 - 批评方法或Deep Q网络来定义代理。

您可以在MATLAB和Simulink中创建环境。金宝app

在Si金宝appmulink中，创建一个描述环境动态和奖励信号的模型。

使用代理块将环境模型与代理连接起来。

对于MATLAB环境，您可以从提供的模板开始，并根据需要进行修改。

您还可以从多个预定义的MATLAB和SIMULINK环境中进行选择。金宝app

要培训代理，请指定培训选项，例如停止标准，并使用代理和环境模型启动培训流程。