主要内容

基于深度神经网络的强化学习

通过与未知动态环境交互来训练深度神经网络代理

强化学习是一种目标导向的计算方法,agent通过与未知的动态环境交互来学习执行任务。在训练期间,学习算法更新代理策略参数。学习算法的目标是找到一个最优策略,使任务期间获得的长期回报最大化。

根据代理的类型,策略由一个或多个策略和值函数表示形式表示。您可以使用深度神经网络实现这些表示。然后,您可以使用强化学习工具箱训练这些网络™ 软件。

有关详细信息,请参阅基于深度神经网络的强化学习.

话题

基于深度神经网络的强化学习

强化学习是一种目标导向的计算方法,计算机通过与未知的动态环境交互来学习执行任务。

创建Simul金宝appink环境并训练Agent

使用Simulink中建模的对象,使用强化学习训练控制器金宝app®作为培训环境。

使用深度网络设计器创建代理和使用图像观察训练

使用Deep learning工具箱中的Deep Network Designer应用程序创建强化学习代理™.

通过图像观察训练DDPG药剂摆动和平衡摆锤

使用基于图像的观察信号训练强化学习代理。

基于并行计算的车道保持辅助训练DQN代理

为车道保持辅助应用程序培训强化学习代理。

用于车道保持辅助的模拟MPC控制器

训练深层神经网络以模拟模型预测控制器的行为。

特色实例