文档帮助中心文档

MATLAB环境

模型强化学习环境动力学使用MATLAB^®

在强化学习场景中，环境模拟agent与之交互的动力学。环境:

从代理接收操作
输出由环境模型的动态行为产生的观察结果
产生一种奖励来衡量行动对完成任务的贡献

您可以在MATLAB中创建预定义和自定义环境。有关更多信息，请参见创建MATLAB强化学习环境．

功能

环境创建

`rlPredefinedEnv`	创建一个预定义的强化学习环境
`rlFunctionEnv`	使用函数指定自定义强化学习环境动态
`rlCreateEnvTemplate`	创建自定义强化学习环境模板
`rlMDPEnv`	建立强化学习的马尔可夫决策过程环境
`createMDP`	建立马尔可夫决策过程模型
`createGridWorld`	为强化学习创建一个二维网格世界
`validateEnvironment`	验证自定义强化学习环境

环境界面

`rlFiniteSetSpec`	为强化学习环境创建离散动作或观察数据规范
`rlNumericSpec`	为强化学习环境创建连续的行动或观察数据规范
`getActionInfo`	从强化学习环境或代理获取动作数据规范
`getObservationInfo`	从强化学习环境或agent获取观测数据规范

主题

创建MATLAB强化学习环境

使用MATLAB对象建模环境动力学，该对象与代理交互，生成奖励和观察响应代理的行动。

创建MATLAB环境强化学习设计器

导入自定义环境或创建预定义环境。

定义奖励信号

创造一个奖励信号来衡量代理人在实现其目标方面的成功程度。

加载预定义的控制系统环境

您可以在预定义的MATLAB控制系统环境中训练代理，其中的动作、观察、奖励和动力学已经定义。

加载预定义的网格世界环境

您可以在预定义的MATLAB网格世界环境中训练代理，这些环境中已经定义了动作、观察和奖励。

创建自定义网格世界环境

您可以通过定义自己的大小、奖励和障碍来创建自定义的MATLAB网格世界环境。

使用自定义函数创建MATLAB环境

通过提供自定义动态函数来创建强化学习环境。

创建自定义MATLAB环境从模板

通过创建和修改模板环境对象，可以自定义强化学习环境。

强化学习工具箱文档

金宝app

强化学习与MATLAB和Simulink金宝app

强化学习与MATLAB和Simulink金宝app

下载电子书