主要内容

inspectTrainingResult

绘制上一训练课程的训练信息

    描述

    默认情况下,火车函数在培训过程中在插曲管理器中显示培训进度和结果。如果将培训配置为不显示“事件管理器”或在培训后关闭“事件管理器”,则可以使用inspectTrainingResult函数,打开插曲管理器。你也可以使用inspectTrainingResult查看培训中保存的座席的培训结果。

    例子

    inspectTrainingResult (trainResults打开插曲管理器并绘制上一个培训会话的培训结果。

    例子

    inspectTrainingResult (agentResults打开插曲管理器,并根据以前保存的代理结构绘制训练结果。

    例子

    全部折叠

    对于本例,假设您已经在MDP环境下训练强化学习代理示例,随后关闭了插曲管理器。

    方法返回的训练信息火车函数。

    负载mdpTrainingStatstrainingStats

    重新打开此培训会话的插曲管理器。

    inspectTrainingResult (trainingStats)

    的环境和代理MDP环境下训练强化学习代理的例子。

    负载mdpAgentAndEnvironment

    指定培训代理的选项。配置SaveAgentCriteria而且SaveAgentValue在30集之后保存所有特工的选项。

    trainOpts = rlTrainingOptions;trainOpts。MaxStepsPerEpisode = 50;trainOpts。MaxEpisodes = 50;trainOpts。情节=“没有”;trainOpts。SaveAgentCriteria =“EpisodeCount”;trainOpts。SaveAgentValue = 30;

    培训代理人。在训练过程中,当一个集的奖励大于或等于13时,代理的副本保存在savedAgents文件夹中。

    rng (“默认”再现率%trainingStats = train(qAgent,env,trainOpts);

    加载其中一个保存的代理的训练结果。这个命令加载代理和包含相应训练结果的结构。

    负载savedAgents / Agent50

    从保存的代理结果结构中查看训练结果。

    inspectTrainingResult (savedAgentResult)

    情节管理器显示到保存代理的情节为止的训练进度。

    输入参数

    全部折叠

    方法返回的结构或结构数组指定为训练集数据火车函数。

    已保存的代理结果,指定为先前由火车函数。的火车属性时保存代理SaveAgentCriteria而且SaveAgentValue的选项。rlTrainingOptions训练时使用的物品。

    加载保存的代理时,代理及其训练结果将添加到MATLAB中®工作空间是saved_agent而且savedAgentResultStruct,分别。要绘制此代理的训练数据,请使用以下命令。

    inspectTrainingResult (savedAgentResultStruct)

    对于多智能体训练,savedAgentResultStruct包含包含所有已训练代理的训练结果的结构字段。

    版本历史

    R2021a中引入

    另请参阅

    功能