主要内容

金宝app环境

利用Simulink模型强化学习环境动力学金宝app®模型

在强化学习场景中,环境模拟agent与之交互的动力学。环境:

  1. 从代理接收操作

  2. 输出由环境模型的动态行为产生的观察结果

  3. 产生一种奖励来衡量行动对完成任务的贡献

您可以使用Simulink模型创建预定义的和自定义的环境。金宝app有关更多信息,请参见创建Simul金宝appink强化学习环境

功能

全部展开

rlPredefinedEnv 创建一个预定义的强化学习环境
rl金宝appSimulinkEnv 使用实现的动态模型创建强化学习环境金宝app
createIntegratedEnv 创建金宝app基于参考模型的强化学习模型
validateEnvironment 验证自定义强化学习环境
金宝appSimulinkEnvWithAgent 强化学习环境与动态模型的实现金宝app
generateRewardFunction 根据控制规范生成奖励函数来训练强化学习代理
exteriorPenalty 一个点相对于有界区域的外部惩罚值
hyperbolicPenalty 一个点相对于有界区域的双曲惩罚值
barrierPenalty 点相对于有界区域的对数势垒惩罚值
rlFiniteSetSpec 为强化学习环境创建离散动作或观察数据规范
rlNumericSpec 为强化学习环境创建连续的行动或观察数据规范
getActionInfo 从强化学习环境或代理获取动作数据规范
getObservationInfo 从强化学习环境或agent获取观测数据规范
bus2RLSpec 为元素创建强化学习数据规范金宝app公共汽车

RL代理 强化学习代理

主题

创建Simul金宝appink强化学习环境

使用与代理交互的Simulink模型建立环境动力学模型,生成响应代理动金宝app作的奖励和观察结果。

为强化学习设计金宝app器创建Simulink环境

导入自定义Simulink环境或金宝app创建预定义的Simulink环境。

定义奖励信号

创造一个奖励信号来衡量代理人在实现其目标方面的成功程度。

加载预定义的Simulink环境金宝app

加载预定义的Simulink控制金宝app系统环境。

水箱加固学习环境模型

创建一个强化学习的Simulink环境,其中包含一个RL代理块,金宝app以代替水箱中水位的控制器。