主要内容

rlPredefinedEnv

创建一个预定义的强化学习环境

描述

例子

env= rlPredefinedEnv (关键字接受一个预定义关键字关键字表示环境名称以创建MATLAB®或仿真金宝app软件®强化学习环境env.环境env模型的动态与代理交互,产生奖励和观察响应代理的行动。

例子

全部折叠

使用预定义的“BasicGridWorld”关键词创建基本网格世界强化学习环境。

env = rlPredefinedEnv (“BasicGridWorld”
env = rlMDPEnv with properties:GridWorld] ResetFcn: []

使用预定义的“DoubleIntegrator-Continuous”关键字创建连续双积分器强化学习环境。

env = rlPredefinedEnv (“DoubleIntegrator-Continuous”
env = DoubleIntegratorContinuousAction with properties: Gain: 1 Ts: 0.1000 MaxDistance: 5 GoalThreshold: 0.0100 Q: [2x2 double] R: 0.0100 MaxForce: Inf State: [2x1 double]

您可以使用情节函数并与之交互重置一步功能。

Plot (env) observation = reset(env)
观察=2×14 0
(观察、奖励、结束)=步骤(env, 16)

图Double Integrator Visualizer包含一个轴对象。axis对象包含一个矩形类型的对象。

观察=2×14.0800 - 1.6000
奖励= -16.5559
结束=逻辑0

使用预定义的“SimplePendulumModel-Continuous”关键词创建连续单摆模型强化学习环境。

env = rlPredefinedEnv (“SimplePendulumModel-Continuous”
env = 金宝appSimulinkEnvWithAgent with properties: Model: rlSimplePendulumModel AgentBlock: rlSimplePendulumModel/RL Agent ResetFcn: [] UseFastRestart: on . env = SimulinkEnvWithAgent with properties: Model: rlSimplePendulumModel

输入参数

全部折叠

预定义的关键字表示环境名称,指定为以下其中之一:

MATLAB环境

  • “BasicGridWorld”

  • “CartPole-Discrete”

  • “CartPole-Continuous”

  • “DoubleIntegrator-Discrete”

  • “DoubleIntegrator-Continuous”

  • “SimplePendulumWithImage-Discrete”

  • “SimplePendulumWithImage-Continuous”

  • “WaterFallGridWorld-Stochastic”

  • “WaterFallGridWorld-Deterministic”

金宝app环境

  • “SimplePendulumModel-Discrete”

  • “SimplePendulumModel-Continuous”

  • “CartPoleSimscapeModel-Discrete”

  • “CartPoleSimscapeModel-Continuous”

输出参数

全部折叠

MATLAB或Sim金宝appulink环境对象,返回如下之一:

  • rlMDPEnv对象,当您使用下列关键字之一时。

    • “BasicGridWorld”

    • “WaterFallGridWorld-Stochastic”

    • “WaterFallGridWorld-Deterministic”

  • CartPoleDiscreteAction对象,当您使用“CartPole-Discrete”关键字。

  • CartPoleContinuousAction对象,当您使用“CartPole-Continuous”关键字。

  • DoubleIntegratorDiscreteAction对象,当您使用“DoubleIntegrator-Discrete”关键字。

  • DoubleIntegratorContinuousAction对象,当您使用“DoubleIntegrator-Continuous”关键字。

  • SimplePendlumWithImageDiscreteAction对象,当您使用“SimplePendulumWithImage-Discrete”关键字。

  • SimplePendlumWithImageContinuousAction对象,当您使用“SimplePendulumWithImage-Continuous”关键字。

  • 金宝appSimulinkEnvWithAgent对象,当您使用下列关键字之一时。

    • “SimplePendulumModel-Discrete”

    • “SimplePendulumModel-Continuous”

    • “CartPoleSimscapeModel-Discrete”

    • “CartPoleSimscapeModel-Continuous”

介绍了R2019a