强化学习斜坡弯道
访问MATLAB通过您的web浏览器
参与视频教程
具有自动化评估和反馈的动手练习
课程只有英文
选择一门课程开始
1.
强化学习概述
熟悉强化学习的概念和课程。
- 什么是强化学习?
- 课程概述
- 用预先训练过的特工进行模拟
2.
定义环境
定义代理如何与环境模型交互。
- 强化学习模型的组成部分
- 定义环境接口
- 奖励和培训
- 包括奖励中的行动
- 连接一个仿真软件金宝app®环境到MATLAB代理
3.
定义代理
创建强化学习代理的表示。
- 批评家和Q值
- 代表批评持续问题的人
- 建立神经网络
- 演员和批评
- 总结的代理
4.
培训代理商
使用模拟片段来训练代理。
- 培训
- 提高培训