inspectTrainingResult

绘制上一训练课程的训练信息

折叠所有页面

语法

inspectTrainingResult (trainResults)

inspectTrainingResult (agentResults)

描述

默认情况下，火车函数在培训过程中在插曲管理器中显示培训进度和结果。如果将培训配置为不显示“事件管理器”或在培训后关闭“事件管理器”，则可以使用inspectTrainingResult函数，打开插曲管理器。你也可以使用inspectTrainingResult查看培训中保存的座席的培训结果。

例子

inspectTrainingResult (trainResults）打开插曲管理器并绘制上一个培训会话的培训结果。

例子

inspectTrainingResult (agentResults）打开插曲管理器，并根据以前保存的代理结构绘制训练结果。

例子

全部折叠

查看以前培训课程的结果

打开实时脚本

对于本例，假设您已经在MDP环境下训练强化学习代理示例，随后关闭了插曲管理器。

方法返回的训练信息火车函数。

负载mdpTrainingStatstrainingStats

重新打开此培训会话的插曲管理器。

inspectTrainingResult (trainingStats)

查看已保存Agent的培训结果

打开实时脚本

的环境和代理MDP环境下训练强化学习代理的例子。

负载mdpAgentAndEnvironment

指定培训代理的选项。配置SaveAgentCriteria而且SaveAgentValue在30集之后保存所有特工的选项。

trainOpts = rlTrainingOptions;trainOpts。MaxStepsPerEpisode = 50;trainOpts。MaxEpisodes = 50;trainOpts。情节=“没有”；trainOpts。SaveAgentCriteria =“EpisodeCount”；trainOpts。SaveAgentValue = 30;

培训代理人。在训练过程中，当一个集的奖励大于或等于13时，代理的副本保存在savedAgents文件夹中。

rng (“默认”）再现率%trainingStats = train(qAgent,env,trainOpts);

加载其中一个保存的代理的训练结果。这个命令加载代理和包含相应训练结果的结构。

负载savedAgents / Agent50

从保存的代理结果结构中查看训练结果。

inspectTrainingResult (savedAgentResult)

情节管理器显示到保存代理的情节为止的训练进度。

输入参数

全部折叠

`trainResults`- - - - - -训练集数据
结构|结构数组

方法返回的结构或结构数组指定为训练集数据火车函数。

`agentResults`- - - - - -保存的代理结果
结构

已保存的代理结果，指定为先前由火车函数。的火车属性时保存代理SaveAgentCriteria而且SaveAgentValue的选项。rlTrainingOptions训练时使用的物品。

加载保存的代理时，代理及其训练结果将添加到MATLAB中^®工作空间是saved_agent而且savedAgentResultStruct,分别。要绘制此代理的训练数据，请使用以下命令。

inspectTrainingResult (savedAgentResultStruct)

对于多智能体训练，savedAgentResultStruct包含包含所有已训练代理的训练结果的结构字段。

版本历史

R2021a中引入

另请参阅

功能

火车

主题

训练强化学习代理