训练DDPG代理摇摆杆与约束
5视图(30天)
显示旧的评论
大家好!
我目前使用钟摆环境和本文档中描述的DDPG代理:
https://nl.mathworks.com/help/reinforcement-learning/ug/train-ddpg-agent-to-swing-up-and-balance-pendulum.html
现在,我希望能再提出一些限制观察和代理之间的Simulink仿真模型(我相信这种技术称为屏蔽)。金宝app例如,我想约束的角速度摆前观察到代理。
我认为一个选项是使用Contraint执行块仿真软件,但是我不确定如何处理实现。金宝app
有人能帮我激活问题?谢谢! !
欢呼:)