主要内容

基于深度神经网络的强化学习

通过与未知动态环境交互训练深度神经网络代理

强化学习是一种目标导向的计算方法,agent通过与未知动态环境交互来学习执行任务。在训练过程中,学习算法更新agent策略参数。学习算法的目标是找到一个最优策略,使任务期间所获得的长期回报最大化。

根据代理的类型,策略由一个或多个策略和值函数表示。您可以使用深度神经网络来实现这些表示。然后,您可以使用强化学习工具箱™软件来训练这些网络。

有关更多信息,请参见基于深度神经网络的强化学习

主题

基于深度神经网络的强化学习

强化学习是一种目标导向的计算方法,计算机通过与未知动态环境交互来学习执行任务。

创建Simul金宝appink环境和Train Agent

用在Simulink中建模的对象使用强化学习训练控制器金宝app®作为培训环境。

使用深度网络设计器创建代理,并使用图像观察训练

使用深度学习工具箱™中的深度网络设计器应用程序创建一个强化学习代理。

用图像观察训练DDPG代理摆起和摆平衡

使用基于图像的观察信号训练一个强化学习代理。

利用并行计算训练DQN代理保持车道辅助

为车道保持辅助应用训练一个强化学习代理。

车道保持辅助的模拟MPC控制器

训练一个深度神经网络来模仿模型预测控制器的行为。

特色的例子