社区概况

照片

"艾哈迈德


最后看到:11个月前|自2022年以来活跃

统计数据

内容提要

视图

问题


我研究路径规划和避障用深强化学习,但是训练不收敛。
下面的代码创建rl代理:criticOpts = rlRepresentationOptions (“LearnRate 1 e - 3,“L2RegularizationFactor 1 e -…

1年前| 1 | 0回答

1

回答