主要内容

培训和验证

训练和模拟强化学习代理

为了学习最优策略,强化学习代理通过重复的试错过程与环境交互。在训练过程中,智能体调整其策略表示的参数以最大化长期奖励。强化学习工具箱(Reinforcement Learning Toolbox™)软件提供训练代理的功能,并通过仿真验证训练结果。有关更多信息,请参见训练强化学习代理

应用程序

强化学习设计师 设计、训练和模拟强化学习代理

功能

全部展开

火车 在指定的环境中训练强化学习代理
rlTrainingOptions 训练强化学习代理的选项
rlMultiAgentTrainingOptions 训练多个强化学习代理的选项
inspectTrainingResult 绘制上一训练课程的训练信息
rlDataLogger 创建文件记录器对象或监视器记录器对象以记录训练数据
FileLogger 将强化学习训练数据记录到MAT文件中
MonitorLogger 将强化学习训练数据记录到监控窗口
trainingProgressMonitor 监控并绘制深度学习自定义训练循环的训练进度
设置 建立强化学习环境或初始化数据记录器对象
商店 将数据存储在(文件或监视器)记录器对象的内部内存中
将存储的数据从内部记录器存储器传输到日志目标
清理 清理强化学习环境或数据记录器对象
sim卡 在指定的环境中模拟训练好的强化学习代理
rlSimulationOptions 用于在环境中模拟强化学习代理的选项
runEpisode 针对策略或智能体模拟强化学习环境
设置 建立强化学习环境或初始化数据记录器对象
清理 清理强化学习环境或数据记录器对象

RL代理 强化学习剂
政策 强化学习策略

主题

训练与模拟基础

使用强化学习设计器应用程序

使用多进程和gpu

训练代理控制双积分系统

训练特工平衡车杆系统

训练特工摆动和平衡钟摆

多代理培训

根据控制规格生成奖励

模仿学习

训练特工控制机器人

训练座席执行控制任务

培训汽车应用代理商

其他应用程序

开发定制代理和训练算法

部署代理和策略