在强化学习场景中,环境模拟agent与之交互的动力学。环境:
从代理接收操作
输出由环境模型的动态行为产生的观察结果
产生一种奖励来衡量行动对完成任务的贡献
您可以在MATLAB中创建预定义和自定义环境。有关更多信息,请参见创建MATLAB强化学习环境.
使用MATLAB对象建模环境动力学,该对象与代理交互,生成奖励和观察响应代理的行动。
导入自定义MATLAB环境或创建预定义的MATLAB环境。
创造一个奖励信号来衡量代理人在实现其目标方面的成功程度。
负载预定义的MATLAB控制系统环境。
您可以在预定义的MATLAB网格世界环境中训练代理,这些环境中已经定义了动作、观察和奖励。
您可以通过定义自己的大小、奖励和障碍来创建自定义的MATLAB网格世界环境。
通过提供自定义动态函数来创建强化学习环境。
通过创建和修改模板环境对象,可以自定义强化学习环境。