从系列中:建模、仿真与控制
塞巴斯蒂安·卡斯特罗
Sebastian Castro演示了一个使用深度强化学习控制仿人机器人运动的示例,特别是深度确定性策略梯度(DDPG)算法。该机器人使用Simscape多体仿真™, 培训时,使用强化学习工具箱完成控制策略™.
在本视频中,Sebastian概述了Simulink强化学习的设置、培训和评估金宝app®模型。首先,他介绍了如何为强化学习问题选择状态、动作和奖励函数。然后介绍了神经网络结构和训练算法参数。最后,他展示了一些培训结果,并讨论了强化学习的优缺点。
您可以在中找到本视频中使用的示例模型MATLAB中央文件交换.
有关详细信息,您可以访问以下资源:
您还可以从以下列表中选择网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区网站未针对您所在地的访问进行优化。