基于深度神经网络的强化学习

通过与未知动态环境交互来训练深度神经网络代理

强化学习是一种目标导向的计算方法，agent通过与未知的动态环境交互来学习执行任务。在训练期间，学习算法更新代理策略参数。学习算法的目标是找到一个最优策略，使任务期间获得的长期回报最大化。

根据代理的类型，策略由一个或多个策略和值函数表示形式表示。您可以使用深度神经网络实现这些表示。然后，您可以使用强化学习工具箱训练这些网络™ 软件。

话题

强化学习是一种目标导向的计算方法，计算机通过与未知的动态环境交互来学习执行任务。

使用Simulink中建模的对象，使用强化学习训练控制器金宝app^®作为培训环境。

使用Deep learning工具箱中的Deep Network Designer应用程序创建强化学习代理™.

使用基于图像的观察信号训练强化学习代理。

为车道保持辅助应用程序培训强化学习代理。

训练深层神经网络以模拟模型预测控制器的行为。

训练强化学习代理控制飞行机器人模型。

打开实时脚本

训练强化学习代理来控制在中建模的两足步行机器人Simscape™多体™.

打开实时脚本

为自适应巡航控制应用培训强化学习代理。

打开实时脚本

为车道跟随应用程序培训强化学习代理。

打开实时脚本

使用遗传算法或强化学习训练仿人机器人行走。

打开实时脚本

培训强化学习代理将车辆停放在开放的停车位。

打开实时脚本

下载电子书