主要内容

金宝app环境

使用Simulink模型增强学习环境动态金宝app®楷模

在强化学习方案中,环境对代理相互作用的动力学建模。环境:

  1. 收到代理商的行动

  2. 由环境模型的动态行为产生的观察结果

  3. 产生奖励,以衡量行动有助于完成任务的能力

您可以使用Simulink模型创建预定义和自定义环境。金宝app有关更多信息,请参阅创建Simul金宝appink增强学习环境

功能

展开全部

rlpredefinedenv 创建预定义的增强学习环境
rl金宝appsimulinkenv 使用实施的动态模型创建强化学习环境金宝app
Create IntegratedEnv 创造金宝app增强学习的模型,使用参考模型作为环境
验证环境 验证自定义增强学习环境
金宝appsimulinkenvwithagent 强化学习环境,采用动态模型金宝app
generatewardwardfunction 从控制规格中产生奖励功能,以训练加强学习代理
外部 相对于有限区域的点的外部罚款值
双曲线苯甲酸 相对于有限区域的点的双曲线罚值
壁垒 相对于有界区域的对数屏障罚值
rlfinitesetspec 为增强学习环境创建离散的动作或观察数据规范
rlnumericspec 为增强学习环境创建连续的动作或观察数据规范
getActioninfo 从强化学习环境或代理中获取行动数据规格
GetObservationinfo 从增强学习环境或代理中获取观察数据规格
BUS2RLSPEC 为一个元素创建强化学习数据规范金宝app公共汽车
重置 重置环境,代理,体验缓冲或策略对象

RL代理 强化学习代理

话题