在强化学习设计师指定培训选项
配置代理的培训强化学习设计应用程序,指定培训选项火车选项卡。
指定基本的选项
在火车选项卡中,可以指定以下基本训练选项。
选项 | 描述 |
---|---|
马克斯集 | 集训练特工的最大数量,指定为一个正整数。 |
马克斯集长度 | 最大数量的步骤运行每集指定为一个正整数。 |
停止条件 | 训练终止条件,指定为以下值之一。
|
停止价值 | 训练终止条件的临界值停止条件,指定为一个标量。 |
平均窗长度 | 窗口长度平均成绩、奖励和代理时的步骤停止条件或保存剂标准指定一个平均的状态。 |
指定附加选项
指定额外的培训方案,火车选项卡上,单击更多的选择。
更多的培训选项对话框,您可以指定以下选项。
选项 | 描述 |
---|---|
保存剂标准 | 条件保存代理培训期间,指定为以下值之一。
|
保存剂价值 | 保存代理条件的关键值保存剂标准,指定为一个标量或“没有” 。 |
保存目录 | 文件夹保存代理。如果您指定一个名称和文件夹不存在,该应用程序在当前工作目录中创建文件夹。 交互式地选择一个文件夹,单击浏览。 |
显示详细的输出 | 选择这个选项在命令行显示培训进展。 |
停在错误 | 选择这个选项停止训练当一个错误发生在一集。 |
培训策划 | 选择图形显示应用的培训进展,指定为以下值之一。
|
指定并行训练选项
训练你的代理使用并行计算的火车选项卡上,单击。培训代理商使用并行计算需要并行计算工具箱™软件。有关更多信息,请参见培训代理商使用并行计算和gpu。
为平行培训指定选项,选择使用并行>并行训练选项。
在并行训练选项对话框,您可以指定以下培训选项。
选项 | 描述 |
---|---|
并行计算模式 | 并行计算模式,指定为以下值之一。
|
转移工作空间变量的工人 | 选择这个选项将模型和并行工人工作空间变量。当您选择此选项,平行池端(开始训练的过程)发送变量用于模型,在MATLAB中定义®工人的工作空间。 |
随机种子的工人 | 随机函数发生器初始化对工人,指定为以下值之一。
|
文件附加到平行池 | 附加文件附加到平行池。在当前工作目录中指定名称的文件,每一行一个名字。 |
工人设置功能 | 函数运行在培训开始前,指定为一个处理函数没有输入参数。这个函数是在培训开始前人均运行一次。编写这个函数来执行任何处理之前,你需要训练。 |
工人清理功能 | 函数运行培训结束后,指定为一个处理函数没有输入参数。您可以编写这个函数清理工作区或执行其他处理训练后终止。 |
下面的图显示了一个示例并行训练配置以下文件和函数。
数据文件附加到池——平行
workerData.mat
工人设置功能,
mySetup.m
工人清理功能,
myCleanup.m