强化学习代理
强化学习工具箱
使用RL代理块在Simulink中模拟和训练强化学习代理金宝app®.将块与存储在MATLAB中的代理关联起来®工作区或数据字典作为代理对象,例如rlACAgent
或rlDDPGAgent
对象。你连接这个块,让它接受一个观察和一个计算奖励。例如,考虑下面的框图rlSimplePendulumModel
模型。
的观察
输入端口RL代理块接收由钟摆的瞬时角度和角速度得到的信号。的奖励
Port将从相同的两个值和应用的操作中获得奖励。您可以配置适合您的系统的观察结果和奖励计算。
该块使用代理生成基于您提供的观察和奖励的行动。连接行动
输出端口到适当的输入为您的系统。例如,在rlSimplePendulumModel
,行动
端口是施加在摆系统上的力矩。有关此模型的更多信息,请参见训练DQN Agent上摆和平衡摆.
要在Simulink中训练强化学习代理,您需要从Simulink模型生成一个环境。金宝app然后创建和配置代理,以便针对该环境进行培训。有关更多信息,请参见创建Simul金宝appink强化学习环境.当你打电话火车
使用环境,火车
模拟模型并更新与块关联的代理。