深度学习

强化学习

深度强化学习是机器学习的一个分支,它使您能够为复杂系统(如机器人和自主系统)实现控制器和决策系统。深度强化学习让您实现深度神经网络,可以通过使用仿真模型动态生成的数据来训练它们,从而学习复杂的行为。它不需要一个预定义的训练数据集,无论标记或未标记,您所需要的是一个模拟模型,该模型表示您正在与之交互并试图控制的环境。

使用MATLAB®,仿金宝app真软件®,强化学习工具箱™您可以完成设计和部署决策系统的完整工作流。您可以:

  • 以简单的控制系统、自主系统和机器人为例,开始强化学习
  • 快速切换、评估和比较流行的强化学习算法,只需要少量的代码更改
  • 使用深度神经网络定义基于图像、视频和传感器数据的复杂强化学习策略
  • 通过使用本地核心或云并行运行多个模拟来更快地训练策略
  • 在嵌入式设备上部署强化学习控制器

强化学习代理

强化学习代理由一个执行从输入状态到输出动作映射的策略和一个负责更新该策略的算法组成。深度q -网络、行为-评论和深度确定性策略梯度是算法的流行例子。算法更新策略,使环境提供的长期奖励信号最大化。

策略可以用深度神经网络、多项式和查找表来表示。然后,您可以实现内置的和自定义代理作为MATLAB对象或Simulink块。金宝app

了解更多

在MATLAB和Simulink环境建模金宝app

强化学习算法的训练是一个动态过程,因为智能体与周围环境进行交互。对于机器人和自主系统这样的应用程序来说,在现实世界中用实际的硬件执行这种训练可能是昂贵和危险的。这就是为什么通过模拟生成数据的环境虚拟模型在强化学习中非常受欢迎。

您可以在MATLAB和Simulink中构建环境模型,描述系统动力学,它们如何受代理所采取的行动的影响,以及评估金宝app所执行的行动的良好程度的奖励。这些模型在本质上可以是连续的,也可以是离散的,并且可以以不同的逼真程度表示系统。此外,您可以并行化模拟以加速训练。在某些情况下,您可以重用现有的MATLAB和Simulink模型的系统,以加强学习的最小修改。金宝app

了解更多

例子及参考应用

开始强化学习吧,通过执行控制器来解决诸如平衡倒立摆、导航网格世界问题和平衡车杆系统等问题。你也可以为自动驾驶汽车设计自适应巡航控制和车道保持辅助系统。强化学习还可以用于机器人应用程序,如轨迹规划,和教学行为,如移动。

了解更多