代理
使用常用算法(如SARSA、DQN、DDPG和PPO)创建和配置强化学习代理
应用程序
强化学习设计师 | 设计、训练和模拟强化学习代理 |
功能
主题
代理基础知识
- 强化学习代理
您可以使用几种标准强化学习算法之一创建代理,也可以定义自己的自定义代理。 - 使用强化学习设计器创建代理
使用强化学习设计器应用程序交互式地创建或导入用于培训的代理。
剂类型
- q学习的代理
为强化学习创建Q-learning代理。 - 撒尔沙代理
创建用于强化学习的SARSA代理。 - 深度q -网络代理
创建用于强化学习的DQN代理。 - 政策梯度代理
创建用于强化学习的PG代理。 - 深度确定性策略梯度代理
创建用于强化学习的DDPG代理。 - 双延迟深度确定性策略梯度代理
创建用于强化学习的TD3代理。 - Actor-Critic代理
创建用于强化学习的AC代理。 - 近端策略优化代理
创建用于强化学习的PPO代理。 - 信任区域策略优化代理
创建用于强化学习的TRPO代理。 - 软演员-评论家代理
创建用于强化学习的SAC代理。 - 基于模型的策略优化代理
基于模型的强化学习代理学习其环境的模型,它可以用来生成额外的训练经验。
自定义代理
- 创建自定义强化学习代理
创建使用自定义强化学习算法的代理。