在强化学习的情况下,环境模型的动态与该代理进行交互。环境:
从代理接收行动
从环境模型的动态行为,由此产生的输出意见
生成奖励测量行动有助于实现任务如何
您可以创建预定义和使用Simulink模型的定制环境。金宝app欲了解更多信息,请参阅创建强化学习的金宝appSimulink环境。
RL代理 | 强化学习代理 |
使用Simulink模型与所述试剂相互作用,产生响应于代理操作的奖励和金宝app观测模型环境动态。
创建一个奖励信号的措施多么成功在药物在实现其目标。
你可以训练的环境中代理商的行动,观察,奖励和动态已经定义了其预定Simulink模型。金宝app
创建包含就位在水箱中的水位控制器的RL代理块强化学习Simuli金宝appnk环境。