在强化学习场景中,环境模拟agent与之交互的动力学。环境:
从代理接收操作
输出由环境模型的动态行为产生的观察结果
产生一种奖励来衡量行动对完成任务的贡献
您可以使用Simulink模型创建预定义的和自定义的环境。金宝app有关更多信息,请参见创建Simul金宝appink强化学习环境.
RL代理 | 强化学习代理 |
使用与代理交互的Simulink模型建立环境动力学模型,生成响应代理动金宝app作的奖励和观察结果。
导入自定义Simulink环境或金宝app创建预定义的Simulink环境。
创造一个奖励信号来衡量代理人在实现其目标方面的成功程度。
加载预定义的Simulink控制金宝app系统环境。
创建一个强化学习的Simulink环境,其中包含一个RL代理块,金宝app以代替水箱中水位的控制器。