强化学习是一种目标导向的计算方法,agent通过与未知的动态环境交互来学习执行任务。在训练期间,学习算法更新代理策略参数。学习算法的目标是找到一个最优策略,使任务期间获得的长期回报最大化。
根据代理的类型,策略由一个或多个策略和值函数表示形式表示。您可以使用深度神经网络实现这些表示。然后,您可以使用强化学习工具箱训练这些网络™ 软件。
有关详细信息,请参阅基于深度神经网络的强化学习.
强化学习是一种目标导向的计算方法,计算机通过与未知的动态环境交互来学习执行任务。
使用Simulink中建模的对象,使用强化学习训练控制器金宝app®作为培训环境。
使用Deep learning工具箱中的Deep Network Designer应用程序创建强化学习代理™.
使用基于图像的观察信号训练强化学习代理。
为车道保持辅助应用程序培训强化学习代理。
训练深层神经网络以模拟模型预测控制器的行为。