RL代理
强化学习剂
- 库:
强化学习工具箱
描述
使用RL代理块在Simulink中模拟和训练一个强化学习代理金宝app®.将块与存储在MATLAB中的代理关联起来®工作区或数据字典,例如rlACAgent
或rlDDPGAgent
对象。你连接块,以便它接收观察和计算奖励。例如,考虑下面的rlSimplePendulumModel
模型。
的观察接口输入端口RL代理Block接收到的信号是由瞬时角度和角速度的摆。的奖励端口收到由相同的两个值和应用的操作计算的奖励。您可以配置适合您的系统的观察和奖励计算。
该块使用代理根据您提供的观察和奖励生成操作。连接行动输出端口到您的系统的适当输入。例如,在rlSimplePendulumModel
,行动输出端口是施加到摆系统上的扭矩。有关此模型的详细信息,请参见训练DQN代理人摆动和平衡摆.
要在Simulink中训练强化学习代理,您需要从Simulink模型生成一个环境。金宝app然后创建并配置代理,以便针对该环境进行培训。有关更多信息,请参见创建Simul金宝appink强化学习环境.当你打电话时火车
利用环境,火车
模拟模型并更新与块关联的代理。
港口
输入
输出
参数
版本历史
在R2019a中引入