利用深神经网络加固学习

通过与未知的动态环境进行互动培训深神经网络代理

加强学习是一种目标定向的计算方法，其中代理学习通过与未知的动态环境进行交互来执行任务。在培训期间，学习算法更新代理策略参数。学习算法的目标是找到最佳策略，最大化任务期间收到的长期奖励。

根据代理的类型，策略由一个或多个策略和值函数表示表示。您可以使用深神经网络实现这些表示。然后，您可以使用强化学习工具箱™软件培训这些网络。

话题

增强学习是一种目标定向的计算方法，计算机学习通过与未知的动态环境进行交互来执行任务。

使用钢筋学习与在Simulink中建模的植物一起培训控制器金宝app^®作为培训环境。

使用深度学习工具箱™使用深网络设计器应用程序创建强化学习代理。

使用基于图像的观察信号列车培训钢筋学习代理。

为车道保留辅助应用培训钢筋学习代理。

火车深度神经网络来模仿模型预测控制器的行为。

培训钢筋学习代理以控制飞行机器人模型。

打开直播脚本

火车加强学习代理以控制建模的双手行走机器人Simscape™多体™。

打开直播脚本

为适应性巡航控制应用培训加固学习代理。

打开直播脚本

培训申请后车道的加强学习代理。

打开直播脚本

培训人形机器人使用遗传算法或加强学习来行走。

打开直播脚本

培训钢筋学习代理将汽车停放在开放的停车位。

打开直播脚本

下载电子书