强化学习

深度加强学习是机器学习的分支，使您能够为机器人和自主系统等复杂系统实现控制器和决策系统。深度加强学习让您实现深度神经网络，可以通过使用仿真模型动态生成的数据来学习复杂行为。它不需要预定义的训练数据集，标记或未标记，您需要的只是一个模拟模型，它代表您与之交互并尝试控制的环境。

使用MATLAB^®,仿金宝app真软件^®，和强化学习工具箱™您可以完成设计和部署决策系统的完整工作流。您可以:

以简单的控制系统、自主系统和机器人为例，开始强化学习
仅通过轻微的代码更改快速切换，评估和比较流行的强化学习算法
使用深神经网络根据图像，视频和传感器数据定义复杂的加固学习策略
通过使用本地核心或云并行运行多个模拟来更快地训练策略
在嵌入式设备上部署强化学习控制器

强化学习代理

强化学习代理由一个执行从输入状态到输出动作映射的策略和一个负责更新该策略的算法组成。深度q -网络、行为-评论和深度确定性策略梯度是算法的流行例子。算法更新策略，使环境提供的长期奖励信号最大化。

政策可以由深神经网络，多项式和查找表来表示。然后，您可以将内置和自定义代理实现为Matlab对象或Simulink块。金宝app

了解更多

Matlab和Simulink中的环境建模金宝app

强化学习算法的训练是一个动态过程，因为智能体与周围环境进行交互。对于机器人和自主系统这样的应用程序来说，在现实世界中用实际的硬件执行这种训练可能是昂贵和危险的。这就是为什么通过模拟生成数据的环境虚拟模型在强化学习中非常受欢迎。

您可以在MATLAB和Simulink中构建环境模型，描述系统动力学，它们如何受代理所采取的行动的影响，以及评估金宝app所执行的行动的良好程度的奖励。这些模型在本质上可以是连续的，也可以是离散的，并且可以以不同的逼真程度表示系统。此外，您可以并行化模拟以加速训练。在某些情况下，您可以重用现有的MATLAB和Simulink模型的系统，以加强学习的最小修改。金宝app