文档帮助中心

代理

创建并使用常见的算法，比如SARSA，DQN，DDPG和A2C配置强化学习代理商

一个强化学习代理接收意见和从环境的奖励。利用其政策，代理人选择基础上的意见和奖励的行为，并将采取行动的环境。在培训过程中，代理不断更新基础上的操作，观察和奖励政策参数。这样做，允许代理学习对于给定的环境和奖励信号最优策略。

强化学习工具箱™软件提供了使用的几个常用算法，如SARSA，DQN，DDPG和A2C强化学习代理商。您还可以通过创建自己的自定义代理实现其他代理算法。欲了解更多信息，请参阅强化学习代理。

有关定义政策表述的更多信息，请参阅创建策略和价值功能交涉。

功能

代理

`rlQAgent`	Q学习强化学习代理
`rlSARSAAgent`	SARSA强化学习代理
`rlDQNAgent`	深Q-网络强化学习代理
`rlPGAgent`	策略梯度强化学习代理
`rlDDPGAgent`	深确定性的政策梯度强化学习代理
`rlTD3Agent`	双延迟深确定性的政策梯度强化学习代理
`rlACAgent`	演员，评论家强化学习代理
`rlPPOAgent`	近端政策优化强化学习代理

代理选项

`rlQAgentOptions`	对于Q学习代理选项
`rlSARSAAgentOptions`	对于SARSA代理选项
`rlDQNAgentOptions`	对于DQN代理选项
`rlPGAgentOptions`	政策梯度代理选项
`rlDDPGAgentOptions`	对于DDPG代理选项
`rlTD3AgentOptions`	对于TD3代理选项
`rlACAgentOptions`	对于AC代理选项
`rlPPOAgentOptions`	近端政策优化强化学习代理选项

获取和设置代表处

`getActor`	从强化学习代理人获取演员的表现
`getCritic`	从强化学习代理人获取评论家表示
`setActor`	强化学习代理的集演员表现
`setCritic`	强化学习剂套装评论家表示

获取行动

的getAction 获得代理或演员表示给定的环境观测行动

主题

强化学习代理

您可以使用几个标准的强化学习算法中的一个代理人或定义自己的代理。

Q学习代理

创建强化学习Q学习代理商。

SARSA代理

创建强化学习SARSA剂。

深Q-网络代理

创建强化学习DQN剂。

政策梯度代理

创建强化学习PG代理商。

深确定性政策梯度代理

创建强化学习DDPG剂。

双延迟深确定性政策梯度代理

创建强化学习DDPG剂。

演员，评论家代理

创建强化学习交流代理商。

近端政策优化代理

创建强化学习PPO剂。

自定义代理

创建药剂的使用习惯强化学习算法。

强化学习工具箱文档

金宝app

尝试MATLAB，Sim金宝appulink和其他产品下载188bet金宝搏

现在就试用