加固学习代理
加固学习工具箱
使用RL代理块在Simulink中模拟和训练强化学习代理金宝app®.将块与存储在MATLAB中的代理关联起来®工作区或数据字典作为代理对象,如rlacagent.
或rlddpgagent.
目的。您连接块,以便它收到观察和计算的奖励。例如,考虑以下框图rlSimplePendulumModel
模型。
这观察
输入端口RL代理块接收从摆锤的瞬时角度和角速度导出的信号。这奖励
端口接收来自相同两个值和应用程序的奖励。您可以配置适合您系统的观测和奖励计算。
该块使用代理基于您提供的观察和奖励来生成动作。连接行动
输出端口到适当的输入为您的系统。例如,在rlSimplePendulumModel
, 这行动
端口是施加在摆系统上的力矩。有关此模型的更多信息,请参见培训DQN Agent以摆动和平衡摆锤.
要在Simulink中培训钢筋学习代理,请从Simulink模型生成一个环境。金宝app然后,您可以创建并配置培训的代理以防止该环境。有关更多信息,请参阅创建Simul金宝appink强化学习环境.你打电话时火车
使用环境,火车
模拟模型并更新与块关联的代理。