主要内容

马铃薯环境

模型加固学习环境动态使用MATLAB®

在加强学习场景中,环境模拟了代理交互的动态。环境:

  1. 从代理商接收行动

  2. 输出由环境模型的动态行为产生的观察

  3. 生成奖励测量的行动有助于实现任务的贡献

您可以在MATLAB中创建预定义和自定义环境。有关更多信息,请参阅创建MATLAB强化学习环境

职能

展开全部

Rlpredefinedenv. 创建预定义的钢筋学习环境
rlfunctionenv. 使用函数指定自定义强化学习环境动态
rlcreateenvtemplate. 创建自定义强化学习环境模板
rlmdpenv. 为强化学习创建马尔可夫决策过程环境
createmdp. 创建马尔可夫决策过程模型
creategridworld. 为强化学习创建二维网格世界
验证环境 验证定制增强学习环境
rlfinitesetspec. 为强化学习环境创建离散动作或观察数据规范
rlnumericspec. 为强化学习环境创建连续动作或观察数据规范
getActionInfo. 从强化学习环境或代理获取行动数据规范
getobservationInfo. 从强化学习环境或代理获得观察数据规范

话题

创建MATLAB强化学习环境

模型环境动态使用MATLAB对象与代理交互,以响应代理操作而生成奖励和观察。

为强化学习设计师创建MATLAB环境

导入自定义环境或创建预定义的环境。

定义奖励信号

创建奖励信号,以衡量代理人在实现目标方面的成功程度。

负载预定义控制系统环境

您可以在预定义的MATLAB控制系统环境中培训代理,用于该系统的行为,观察,奖励和动态。

加载预定义网格世界环境

您可以在预定义的MATLAB网格世界环境中培训代理,用于该环境,操作,观察和奖励已经定义。

创建自定义网格世界环境

您可以通过定义自己的大小,奖励和障碍来创建自定义MATLAB网格世界环境。

使用自定义功能创建MATLAB环境

通过提供自定义动态功能来创建强化学习环境。

从模板创建自定义MATLAB环境

您可以通过创建和修改模板环境对象来定义自定义增强学习环境。