主要内容

培训和验证

训练和模拟强化学习代理

为了学习最优策略,强化学习代理通过重复的试错过程与环境交互。在训练过程中,智能体调整其策略表示的参数以最大化长期奖励。强化学习工具箱(Reinforcement Learning Toolbox™)软件提供训练代理的功能,并通过仿真验证训练结果。有关更多信息,请参见训练强化学习代理

应用程序

强化学习设计师 设计、训练和模拟强化学习代理

功能

全部展开

火车 在指定的环境中训练强化学习代理
rlTrainingOptions 训练强化学习代理的选项
rlMultiAgentTrainingOptions 训练多个强化学习代理的选项
inspectTrainingResult 绘制上一训练课程的训练信息
sim卡 在指定的环境中模拟训练好的强化学习代理
rlSimulationOptions 用于在环境中模拟强化学习代理的选项
runEpisode 针对策略或智能体模拟强化学习环境
设置 建立强化学习环境,运行多个模拟
清理 在运行多个模拟后清理强化学习环境

RL代理 强化学习剂

主题

训练与模拟基础

使用强化学习设计器App

使用多进程和gpu

培训代理人MATLAB环境

培训代理人金宝app环境

多代理培训

根据控制规格生成奖励

模仿学习

自定义代理和训练算法