Emmanouil Tzorakoleftherakis,Mathworks
钢筋学习工具箱™提供MATLAB®函数和模拟链接金宝app®使用加固学习算法包括DQN,A2C和DDPG的培训政策。该工具箱可让您实现控制器和决策系统,用于复杂的应用程序,如机器人,自驾驶汽车等等。
您可以使用深神经网络,多项式或查找表代表策略和价值函数。通过启用强化学习代理与Matlab或Simulink中创建的环境进行交互来培训策略。金宝app评估内置和自定义算法,使用HyperParameter设置进行实验,并监控培训进度。通过并行化模拟和计算对多核CPU,GPU,计算机集群和云资源(使用并行计算工具箱™和MATLABPLILLANT SELVER™)来加速培训。
您可以通过Onnx™模型格式(具有深度学习工具箱™),从Deave Learning框架(如Tensorflow™Keras和Pytorch)导入现有策略。生成优化的C,C ++和CUDA代码,以在嵌入式平台上部署培训的策略。该工具箱包括使用加强学习的参考示例,用于设计用于机器人和自动化驾驶应用的控制器。
加固学习工具箱提供功能和块,让您实现自治系统的控制器和决策算法,例如机器人和自动驾驶汽车。
工具箱使您可以通过MATLAB和Simulink创建生长学习工作流程的所有步骤,从创建环境和代理到策略培训和部署。金宝app
使用深度网络设计师或以内置功能以编程方式创建深度神经网络策略和价值函数。
除神经网络外,还支持多项式和查找表。金宝app
通过将策略与内置培训算法组合,例如演员 - 批评方法或Deep Q网络来定义代理。
您可以在Matlab和Simulink中创建环境。金宝app
在Si金宝appmulink中,创建一个描述环境动态和奖励信号的模型。
使用代理程序块与代理接口环境模型。
对于MATLAB环境,您可以从提供的模板开始并根据需要进行修改。
您还可以从多个预定义的MATLAB和SIMULINK环境中进行选择。金宝app
要培训代理,请指定培训选项,例如停止标准,并使用代理和环境模型启动培训流程。
并行计算工具箱和MATLAB并行服务器通过并行化模拟和计算,让您加速培训。
在培训期间,Episode Manager帮助您在视觉上监控培训进度并提供摘要统计数据。
培训完成后,您可以使用模拟环境验证培训的代理,您可以生成CUDA和C / C ++代码以部署培训的策略。
有关加强学习工具箱的更多信息,请参阅文档并提供示例。
立即开始免费试用强化学习工具箱。
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。