代理
创建和配置强化学习代理使用常见的算法,如撒尔沙,DQN DDPG, PPO
应用程序
强化学习设计 | 设计、训练和模拟强化学习代理 |
功能
主题
代理基础知识
- 强化学习代理
您可以创建一个代理使用一种标准的强化学习算法或定义自己的自定义代理。 - 使用强化学习设计师创建代理
交互式地创建或导入代理培训使用强化学习设计应用程序。
剂类型
- q学习的代理
为强化学习创建q学习的代理。 - 撒尔沙代理
为强化学习创建撒尔沙代理。 - 深Q-Network代理
为强化学习创建DQN代理。 - 政策梯度代理
为强化学习创建PG代理。 - 深决定性策略梯度代理
为强化学习创建DDPG代理。 - Twin-Delayed深决定性策略梯度代理
为强化学习创建TD3代理。 - Actor-Critic代理
为强化学习创造交流人员。 - 近端政策优化代理
为强化学习创建PPO代理。 - 信赖域策略优化代理
为强化学习创建TRPO代理。 - 软Actor-Critic代理
为强化学习创建囊制剂。 - 基于模型的政策优化代理
基于模型的强化学习代理模型的学习环境,它可以使用它来生成额外的培训经验。
自定义代理
- 创建自定义强化学习代理
创建代理使用定制的强化学习算法。