来自系列:建模,仿真和控制
Sebastian Castro,Mathworks
Sebastian Castro演示了使用深度加强学习控制人形机器人机器的示例,特别是深度确定性政策梯度(DDPG)算法。使用Simsceive Multibody™模拟机器人,同时使用强化学习工具箱™进行培训控制策略。
在此视频中,Sebastian概述了使用Simulink的加强学习的设置,培训和评估金宝app®楷模。首先,他介绍了如何选择强化学习问题的国家,行动和奖励功能。然后他描述了神经网络结构和训练算法参数。最后,他展示了一些培训结果,并探讨了加强学习的益处和缺点。
您可以找到此视频中使用的示例模型MATLAB中央档案交换。
有关更多信息,您可以访问以下资源:
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。