强化学习代理
强化学习工具箱
使用RL代理在Simulink中模拟和训练强化学习代理的块金宝app®.将块与存储在MATLAB中的代理关联起来®工作区或数据字典作为代理对象,例如拉卡金特
或RLDDPG试剂
对象连接块,使其接收观察和计算的奖励。例如,考虑下面的框图rlSimplePendulumModel
模型
这个观察
输入端口RL代理块接收从摆锤的瞬时角度和角速度导出的信号。这个奖励
端口接收根据相同的两个值和应用的操作计算的奖励。您可以配置适合您的系统的观察和奖励计算。
块使用代理根据您提供的观察和奖励生成操作。连接行动
输出端口到适当的输入为您的系统。例如,在rlSimplePendulumModel
这个行动
端口是施加在摆系统上的力矩。有关此模型的更多信息,请参见培训DQN代理摆动并平衡摆锤.
要在Simulink中训练强化学习代理,需要从Simulink模型生成一个环境。然后创金宝app建并配置代理,以便针对该环境进行培训。有关详细信息,请参阅创建Simul金宝appink强化学习环境. 当你打电话的时候火车
利用环境,火车
模拟模型并更新与块关联的代理。