MATLAB环境
使用MATLAB模型强化学习环境动力学®
在强化学习的情况下,环境模型的动态代理进行交互。环境:
从代理接收行为
造成输出观测环境的动态行为模型
生成一个奖励测量的行动有助于实现这一任务
您可以创建预定义和自定义在MATLAB环境中。有关更多信息,请参见创建MATLAB强化学习环境。
功能
主题
使用MATLAB环境动力学模型与代理交互的对象,产生回报和观察代理人的行为的反应。
导入一个定制的MATLAB环境或创造一个预定义的MATLAB环境。
创建一个奖励的信号,衡量成功的代理是在实现其目标。
负载预定义的MATLAB控制系统环境。
预定义的MATLAB世界网格环境中你可以训练特工的行动,观察,和奖励已经定义。
您可以创建定制的MATLAB网格世界环境通过定义自己的大小,奖励和障碍。
创建一个强化学习环境提供定制的动态功能。
您可以定义一个自定义的强化学习环境通过创建和修改模板环境对象。