主要内容

MATLAB环境

使用MATLAB模型强化学习环境动力学®

在强化学习的情况下,环境模型的动态代理进行交互。环境:

  1. 从代理接收行为

  2. 造成输出观测环境的动态行为模型

  3. 生成一个奖励测量的行动有助于实现这一任务

您可以创建预定义和自定义在MATLAB环境中。有关更多信息,请参见创建MATLAB强化学习环境

功能

全部展开

rlPredefinedEnv 创建一个预定义的强化学习的环境
rlFunctionEnv 指定自定义使用功能强化学习环境动力学
rlCreateEnvTemplate 创建自定义模板强化学习环境
rlMDPEnv 为强化学习创造马尔可夫决策过程的环境
createMDP 创建马尔可夫决策过程模型
createGridWorld 创建一个二维网格世界强化学习
validateEnvironment 验证自定义强化学习环境
generateRewardFunction 生成一个奖励函数控制规范训练强化学习代理
exteriorPenalty 外部惩罚值对一个有界区域
hyperbolicPenalty 双曲惩罚值对一个有界区域
barrierPenalty 对数障碍罚值对一个有界区域
rlFiniteSetSpec 创建离散行动或观测数据规范强化学习环境
rlNumericSpec 创建持续的行动或观测数据规范强化学习环境
getActionInfo 从强化学习获得行动数据规范环境或代理
getObservationInfo 从强化学习获得观测数据规范环境或代理

主题

创建MATLAB强化学习环境

使用MATLAB环境动力学模型与代理交互的对象,产生回报和观察代理人的行为的反应。

为强化学习设计师创建MATLAB环境中

导入一个定制的MATLAB环境或创造一个预定义的MATLAB环境。

定义奖励信号

创建一个奖励的信号,衡量成功的代理是在实现其目标。

负载预定义的控制系统环境

负载预定义的MATLAB控制系统环境。

网格负载预定义的世界环境

预定义的MATLAB世界网格环境中你可以训练特工的行动,观察,和奖励已经定义。

创建自定义网格的世界环境

您可以创建定制的MATLAB网格世界环境通过定义自己的大小,奖励和障碍。

创建MATLAB环境中使用自定义函数

创建一个强化学习环境提供定制的动态功能。

从模板创建定制的MATLAB环境

您可以定义一个自定义的强化学习环境通过创建和修改模板环境对象。