视频和网络研讨会

基于图像数据的倒立摆强化学习

Emmanouil Tzorakoleftherakis, MathWorks

使用强化学习工具箱™和DQN算法来执行单摆的基于图像的反演。该工作流包括以下步骤:1)创建环境，2)指定策略表示，3)创建代理，4)训练代理，5)验证训练过的策略。

所提供的钟摆环境具有预先定义的观察、行动和奖励。动作包括5个可能的扭矩值，观察包括一个50x50灰度图像以及钟摆的角速度，奖励是到期望的向上位置的距离。学习如何使用深度网络设计应用程序来构建q函数的神经网络表示，DQN代理使用它来近似长期回报。

看看如何在训练过程中可视化钟摆行为，并监控训练进度。训练完成后，在模拟中验证策略，以决定是否需要进一步的训练。

相关产品下载188bet金宝搏

了解更多

什么是强化学习?

桥接无线通信设计与MATLAB测试

读白皮书

深度学习和传统机器学习:选择正确的方法

读电子书

电力电子控制设计的半实物测试

读白皮书

基于MATLAB的预测性维护

读电子书

相关信息

从强化学习开始

特色产品

强化学习工具箱

下一个:

汽车产品开发的最优神经网络

相关视频:

基于SimMechanics和QUARC的倒立摆控制

信号处理和机器学习技术…

使用图像来查看数据，而不是冲浪和查看(2)

物理建模:建立一个旋转摆

查看更多相关视频