视频和网络研讨会

基于图像数据的倒立摆强化学习

艾曼努伊尔·佐拉科勒菲瑟拉基斯，MathWorks

使用强化学习工具箱™ 该工作流包括以下步骤：1）创建环境，2）指定策略表示，3）创建代理，4）训练代理，5）验证训练过的策略。

所提供的摆锤环境具有预定义的观察、动作和奖励。动作包括五个可能的扭矩值，观察包括50x50灰度图像以及摆锤的角速率，奖励是从所需向上位置的距离。了解如何使用Deep Network Designer app构建Q函数的神经网络表示，由DQN代理用于近似长期奖励。

看看你如何在训练中可视化钟摆的行为，并监控训练的进展。培训完成后，在模拟中验证策略，以决定是否需要进一步的培训。

相关产品下载188bet金宝搏

了解更多

什么是强化学习？

加速模型预测控制器的3种方法

阅读白皮书

深度学习实用指南：从数据到部署

读电子书

基于MATLAB的桥接无线通信设计与测试

阅读白皮书

深度学习与传统机器学习：选择正确的方法

读电子书

电力电子控制设计的半实物测试

阅读白皮书

基于MATLAB的预测维修

读电子书

电动汽车建模与仿真-从体系结构到部署：网络研讨会系列

免费注册

您对电源转换控制了解多少？

开始测验

相关信息

开始强化学习入门课程

特色产品

强化学习工具箱

下一步：

汽车产品开发的最优神经网络

相关视频：

基于SimMechanics和QUARC的倒立摆控制

信号处理和机器学习技术。。。

使用图像查看数据而不是浏览和查看（2）

物理建模：构建旋转摆

查看更多相关视频