在这个问题上好的更新/解决方案。目前(2021年版)强化学习设计师不是功能corectly时执行costom env。ResetFcn和回采仿真停止sim(结束)criterum时实现。唯一的办法就可以正确地得到这个功能脂肪酸是真的老脚本方法(模拟的例子:
openExample (rl / SimscapeCartpoleDDPGExample)
)。
希望这可以帮助到一些人打交道些微相同的问题。