主要内容

MATLAB环境

模型强化学习环境动力学使用MATLAB®

在强化学习场景中,环境模拟agent与之交互的动力学。环境:

  1. 从代理接收操作

  2. 输出由环境模型的动态行为产生的观察结果

  3. 产生一种奖励来衡量行动对完成任务的贡献

您可以在MATLAB中创建预定义和自定义环境。有关更多信息,请参见创建MATLAB强化学习环境

功能

全部展开

rlPredefinedEnv 创建一个预定义的强化学习环境
rlFunctionEnv 使用函数指定自定义强化学习环境动态
rlCreateEnvTemplate 创建自定义强化学习环境模板
rlMDPEnv 建立强化学习的马尔可夫决策过程环境
createMDP 建立马尔可夫决策过程模型
createGridWorld 为强化学习创建一个二维网格世界
validateEnvironment 验证自定义强化学习环境
rlFiniteSetSpec 为强化学习环境创建离散动作或观察数据规范
rlNumericSpec 为强化学习环境创建连续的行动或观察数据规范
getActionInfo 从强化学习环境或代理获取动作数据规范
getObservationInfo 从强化学习环境或agent获取观测数据规范

主题

创建MATLAB强化学习环境

使用MATLAB对象建模环境动力学,该对象与代理交互,生成奖励和观察响应代理的行动。

创建MATLAB环境强化学习设计器

导入自定义环境或创建预定义环境。

定义奖励信号

创造一个奖励信号来衡量代理人在实现其目标方面的成功程度。

加载预定义的控制系统环境

您可以在预定义的MATLAB控制系统环境中训练代理,其中的动作、观察、奖励和动力学已经定义。

加载预定义的网格世界环境

您可以在预定义的MATLAB网格世界环境中训练代理,这些环境中已经定义了动作、观察和奖励。

创建自定义网格世界环境

您可以通过定义自己的大小、奖励和障碍来创建自定义的MATLAB网格世界环境。

使用自定义函数创建MATLAB环境

通过提供自定义动态函数来创建强化学习环境。

创建自定义MATLAB环境从模板

通过创建和修改模板环境对象,可以自定义强化学习环境。