基于深度神经网络的强化学习

通过与未知动态环境交互训练深度神经网络代理

强化学习是一种目标导向的计算方法，agent通过与未知动态环境交互来学习执行任务。在训练过程中，学习算法更新agent策略参数。学习算法的目标是找到一个最优策略，使任务期间所获得的长期回报最大化。

根据代理的类型，策略由一个或多个策略和值函数表示。您可以使用深度神经网络来实现这些表示。然后，您可以使用强化学习工具箱™软件来训练这些网络。

主题

强化学习是一种目标导向的计算方法，计算机通过与未知动态环境交互来学习执行任务。

用在Simulink中建模的对象使用强化学习训练控制器金宝app^®作为培训环境。

使用深度学习工具箱™中的深度网络设计器应用程序创建一个强化学习代理。

使用基于图像的观察信号训练一个强化学习代理。

为车道保持辅助应用训练一个强化学习代理。

训练一个深度神经网络来模仿模型预测控制器的行为。

训练一个强化学习代理来控制一个飞行机器人模型。

打开生活的脚本

训练一个强化学习代理来控制模型中的两足步行机器人Simscape™多体™．

打开生活的脚本

训练一个强化学习代理为自适应巡航控制应用。

打开生活的脚本

为车道跟踪应用程序训练一个强化学习代理。

打开生活的脚本

用遗传算法或强化学习训练一个人形机器人走路。

打开生活的脚本

训练一个强化学习代理在一个开放的停车位停车。

打开生活的脚本

下载电子书