主要内容

金宝app环境

使用Simulink模型强化学习环境动态金宝app®楷模

在加强学习场景中,环境模拟了代理交互的动态。环境:

  1. 从代理商接收行动

  2. 输出由环境模型的动态行为产生的观察

  3. 生成奖励测量的行动有助于实现任务的贡献

您可以使用Simulink模型创建预定义和自定义环境。金宝app有关更多信息,请参阅创建Simul金宝appink强化学习环境

职能

展开全部

Rlpredefinedenv. 创建预定义的钢筋学习环境
Rl金宝appsimulinkenv. 使用IN实现的动态模型创建强化学习环境金宝app
CreateIntegrateenv. 创造金宝app钢筋学习模型,使用参考模型作为环境
验证环境 验证定制增强学习环境
金宝appSimulinkenvwithagent. 具有动态模型的强化学习环境金宝app
rlfinitesetspec. 为强化学习环境创建离散动作或观察数据规范
rlnumericspec. 为强化学习环境创建连续动作或观察数据规范
getActionInfo. 从强化学习环境或代理获取行动数据规范
getobservationInfo. 从强化学习环境或代理获得观察数据规范
bus2rlspec. 为一个元素创建强化学习数据规范金宝app公共汽车

RL代理人 加固学习代理

话题

创建Simul金宝appink强化学习环境

模型环境动态使用Simulink模型与代理交互,以响应代理操作而生成奖金宝app励和观察。

为强化学习设计金宝app师创建Simulink环境

导入自定义环境或创建预定义的环境。

定义奖励信号

创建奖励信号,以衡量代理人在实现目标方面的成功程度。

加载预定义的Simulink环境金宝app

您可以在预定义的Simulink模型中培训代理程序,用于该模型的操作,观察,奖励和动态。金宝app

水箱加固学习环境模型

创建一个加强学习模拟环境,该环境包含RL代理块,代替坦克中的水位金宝app的控制器。