帮助中心帮助中心

强化学习使用深层神经网络

火车深层神经网络代理与未知的动态环境中交互

强化学习是一种目标导向的计算方法,其中一个代理学会执行任务与未知的动态环境中交互。在培训过程中,参数学习算法更新代理政策。学习算法的目标是找到一个最优策略,最大化长期任务期间所得到的奖励。

根据代理的类型,政策是由一个或多个政策和价值函数表示。你可以使用深层神经网络实现这些表示。然后您可以使用强化学习训练这些网络工具箱™软件。

有关更多信息,请参见强化学习使用深层神经网络。

主题

强化学习使用深层神经网络
强化学习是一种目标导向的计算方法在计算机学会执行任务与一个未知的动态环境中交互。
创建仿真软件环金宝app境和培训代理
火车一个控制器使用强化学习和植物建模仿真软件金宝app^®培训环境。
使用深度网络设计师创建代理和培训使用图像的观察
创建一个强化学习代理使用深层网络设计师从深度学习工具箱™应用程序。
火车DDPG代理摇摆起来,平衡摆与图像观察
训练强化学习代理使用一个基于图像的观察信号。
火车DQN代理车道保持辅助使用并行计算
训练强化学习代理一个车道保持辅助应用程序。
模仿MPC控制器车道保持辅助
火车深神经网络模拟模型预测控制器的行为。

特色的例子

火车DDPG剂来控制飞行机器人

火车DDPG剂来控制飞行机器人

训练强化学习代理来控制飞行机器人模型。

打开生活的脚本

两足机器人使用强化学习代理行走训练

两足机器人使用强化学习代理行走训练

训练强化学习代理控制的双足步行机器人建模Simscape™多体™。

打开生活的脚本

火车DDPG代理自适应巡航控制的功能

火车DDPG代理自适应巡航控制的功能

火车的强化学习代理自适应巡航控制的应用程序。

打开生活的脚本

火车DDPG代理路径跟踪控制

火车DDPG代理路径跟踪控制

训练后巷的强化学习代理应用程序。

打开生活的脚本

火车人形沃克

火车人形沃克

火车一个仿人机器人行走使用遗传算法或强化学习。

打开生活的脚本

火车PPO代理自动代客停车

火车PPO代理自动代客停车

训练强化学习代理公园一辆车在一个开放的停车位。

打开生活的脚本