ビデオ·网セミナー

用图像数据的倒立摆的加固学习

Emmanouil Tzorakoleftherakis，Mathworks

使用强化学习工具箱™和DQN算法执行简单摆的基于图像的反演。工作流由以下步骤组成：1）创建环境，2）指定策略表示，3）创建代理，4）列车代理和5）验证培训的策略。

提供的摆锤环境具有预定义的观察，行动和奖励。该动作包括五种可能的扭矩值，观察结果包括50x50灰度图像以及摆锤的角速率，并且奖励是距离所需向上位置的距离。了解如何使用深网络设计器应用程序构建Q函数的神经网络表示，由DQN代理用于近似长期奖励。

了解如何在培训期间可视化摆动行为，并监控培训进度。完成培训后，验证模拟中的策略以决定是否需要进一步培训。

相关产品下载188bet金宝搏

了解更多

強化学習 – これだけは知っておきたい3.つのこと

加速模型预测控制器的3种方法

阅读白皮书

深度学习的实用指南：从数据到部署

阅读电子书

桥接无线通信设计与Matlab测试

阅读白皮书

深度学习和传统机器学习：选择正确的方法

阅读电子书

电力电子控制设计的硬件循环测试

阅读白皮书

用Matlab预测维护

阅读电子书

电动车型建模与仿真 - 部署架构：网络研讨会系列

免费注册

您对电源转换控制的了解了多少？

开始测验

相关信息

开始使用加固学习ondramp

特色产品

加固学习工具箱

下一个：

汽车产品开发的最佳神经网络

有关的影片：

使用SimMechanics和Farpc的倒立摆控制

信号处理和机器学习技术......

使用图像查看数据而不是冲浪和视图（2）

物理建模：建立旋转摆锤

查看更多相关视频