帮助中心帮助中心

金宝app环境

使用仿真软件模型强化学习环境动力学金宝app^®模型

在强化学习的情况下,环境模型的动态代理进行交互。环境:

从代理接收行为
造成输出观测环境的动态行为模型
生成一个奖励测量的行动有助于实现这一任务

您可以创建预定义和自定义环境使用仿真软件模型。金宝app有关更多信息,请参见创建模型强化学金宝app习环境。

功能

环境创建

`rlPredefinedEnv`	创建一个预定义的强化学习的环境
`rl金宝appSimulinkEnv`	创建使用动态模型中实现强化学习环境金宝app
`createIntegratedEnv`	创建金宝app为强化学习模型,利用参考模型的环境
`validateEnvironment`	验证自定义强化学习环境
`金宝appSimulinkEnvWithAgent`	强化学习环境中实现动态模型金宝app

奖励计算

`generateRewardFunction`	生成一个奖励函数控制规范训练强化学习代理
`exteriorPenalty`	外部惩罚值对一个有界区域
`hyperbolicPenalty`	双曲惩罚值对一个有界区域
`barrierPenalty`	对数障碍罚值对一个有界区域

环境界面

`rlFiniteSetSpec`	创建离散行动或观测数据规范强化学习环境
`rlNumericSpec`	创建持续的行动或观测数据规范强化学习环境
`getActionInfo`	从强化学习获得行动数据规范环境或代理
`getObservationInfo`	从强化学习获得观测数据规范环境或代理
`bus2RLSpec`	创建强化学习数据规范的元素金宝app公共汽车

重置环境

`重置`	重置环境、代理经验缓冲区,或政策对象

块

强化学习代理

主题

创建模型强化学金宝app习环境
模型使用仿真软件环境动力学模型与代理进行交互,产生回报和观察代理人的行金宝app为的反应。
为强化学习设计金宝app师创建仿真软件环境
导入自定义仿真软件环境或创造一个金宝app预定义的仿真软件环境。
定义奖励信号
创建一个奖励的信号,衡量成功的代理是在实现其目标。
负载预定义的仿真软件环境金宝app
负载预定义的控制系统仿真软件环境金宝app。
水箱强化学习环境模型
创建一个强化学习仿真软件环境,包含一个RL代理块代替水箱的水位控金宝app制器。