Emmanouil Tzorakoleftherakis, MathWorks
钢筋学习工具箱™提供MATLAB®函数和模拟链接金宝app®使用DQN、A2C、DDPG等强化学习算法训练策略的模块。工具箱可以为机器人、自动驾驶汽车等复杂应用实现控制器和决策系统。
您可以使用深神经网络,多项式或查找表代表策略和价值函数。通过启用强化学习代理与Matlab或Simulink中创建的环境进行交互来培训策略。金宝app评估内置和自定义算法,使用HyperParameter设置进行实验,并监控培训进度。通过并行化模拟和计算对多核CPU,GPU,计算机集群和云资源(使用并行计算工具箱™和MATLABPLILLANT SELVER™)来加速培训。
您可以通过ONNX模型格式(使用深度学习工具箱™)从TensorFlow™Keras和PyTorch等深度学习框架中导入现有策略。生成优化的C、c++和CUDA代码,在嵌入式平台上部署训练有素的策略。工具箱包括使用强化学习设计机器人和自动驾驶应用控制器的参考例子。
Reinforcement Learning Toolbox提供了一些函数和模块,让你为机器人和自动驾驶汽车等自动系统实现控制器和决策算法。
工具箱使您可以通过MATLAB和Simulink创建生长学习工作流程的所有步骤,从创建环境和代理到策略培训和部署。金宝app
使用深度网络设计器或通过编程方式使用内置函数创建深度神经网络策略和值函数。
除神经网络外,还支持多项式和查找表。金宝app
通过将策略与内置培训算法组合,例如演员 - 批评方法或Deep Q网络来定义代理。
您可以在MATLAB和Simulink中创建环境。金宝app
在Si金宝appmulink中,创建一个描述环境动态和奖励信号的模型。
使用代理块将环境模型与代理连接起来。
对于MATLAB环境,您可以从提供的模板开始,并根据需要进行修改。
您还可以从多个预定义的MATLAB和SIMULINK环境中进行选择。金宝app
要培训代理,请指定培训选项,例如停止标准,并使用代理和环境模型启动培训流程。
并行计算工具箱和MATLAB并行服务器让你加速训练通过并行模拟和计算。
在培训期间,集管理器可以帮助您可视化地监控培训进度并提供汇总统计数据。
培训完成后,您可以使用模拟环境验证培训的代理,您可以生成CUDA和C / C ++代码以部署培训的策略。
有关加强学习工具箱的更多信息,请参阅文档并提供示例。
立即开始免费试用强化学习工具箱。
您也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳的网站性能。其他MathWorks国家网站没有针对您所在位置的访问进行优化。
本网站使用cookie来改善您的用户体验,个性化内容和广告,并分析网站流量。通过继续使用本网站,您同意我们使用cookie。请看我们隐私政策要了解有关cookie的更多信息以及如何更改设置。