主要内容

inspectTrainingResult

情节从先前的训练培训信息

自从R2021a

    描述

    默认情况下,火车函数显示了培训在事件管理器进程和结果。如果您配置的培训没有显示这一事件经理或者你关闭事件经理培训后,您可以查看使用培训结果inspectTrainingResult函数,它打开事件管理器。您还可以使用inspectTrainingResult查看代理商的培训结果保存在训练。

    例子

    inspectTrainingResult (trainResults)打开事件管理器和情节训练结果从先前的训练。

    例子

    inspectTrainingResult (agentResults)打开事件管理器和情节的训练结果之前保存剂结构。

    例子

    全部折叠

    对于这个示例,假设您有代理的培训MDP环境中训练强化学习代理例子,随后关闭事件管理器。

    负载返回的培训信息火车函数。

    负载mdpTrainingStatstrainingStats

    重新训练集管理器。

    inspectTrainingResult (trainingStats)

    对于这个示例,负载的环境和代理MDP环境中训练强化学习代理的例子。

    负载mdpAgentAndEnvironment

    为培训代理指定选项。配置SaveAgentCriteriaSaveAgentValue选项后保存所有代理30集。

    trainOpts = rlTrainingOptions;trainOpts。MaxStepsPerEpisode = 50;trainOpts。MaxEpisodes = 50;trainOpts。情节=“没有”;trainOpts。SaveAgentCriteria =“EpisodeCount”;trainOpts。SaveAgentValue = 30;

    培训代理。在培训期间,一集一个奖励大于或等于13,一份保存在一个代理savedAgents文件夹中。

    rng (“默认”)%的再现性env, trainingStats =火车(qAgent trainOpts);

    负荷训练结果保存的代理商之一。这个命令加载代理和一个结构,其中包含相应的训练结果。

    负载savedAgents / Agent50

    查看培训结果保存剂结果结构。

    inspectTrainingResult (savedAgentResult)

    事件管理器显示了培训进度的事件代理得救了。

    输入参数

    全部折叠

    训练集数据,指定为返回的数组的结构或结构火车函数。

    保存剂结果,指定为一个结构以前保存的火车函数。的火车当你指定函数保存代理SaveAgentCriteriaSaveAgentValue选项的rlTrainingOptions对象中使用培训。

    加载保存剂时,代理及其训练结果添加到MATLAB®工作空间是saved_agentsavedAgentResultStruct,分别。绘制该代理的训练数据,使用下面的命令。

    inspectTrainingResult (savedAgentResultStruct)

    多代理培训,savedAgentResultStruct包含结构字段与培训结果的训练有素的特工。

    版本历史

    介绍了R2021a

    另请参阅

    功能