主要内容

rlSimulationOptions

选择模拟强化学习代理在一个环境

自从R2019a

描述

使用一个rlSimulationOptions对象指定模拟选项模拟强化学习代理在一个环境。执行模拟,使用sim卡

代理商培训和模拟的更多信息,请参阅强化学习培训代理

创建

描述

simOpts= rlSimulationOptions返回默认选项对代理模拟钢筋的学习环境。使用模拟选项来指定参数的仿真等步骤运行的最大数量/仿真和模拟运行的数量。配置选项,后使用simOpts作为一个输入参数sim卡

例子

选择= rlSimulationOptions (名称,值)创建一个模拟与指定的选项设置属性使用一个或多个名称-值对参数。

属性

全部展开

步骤运行仿真,指定为逗号分隔组成的“MaxSteps”和一个正整数。一般来说,您定义事件终止条件环境。这个值是步骤运行的最大数量的模拟如果不满足终止条件。

例子:“MaxSteps”, 1000年

数量的模拟运行,指定为逗号分隔组成的“NumSimulations”和一个正整数。在每个仿真的开始,sim卡重置环境。您指定环境重置会发生什么当你创造环境。例如,重置环境在每集的开始可以包括随机的初始状态值,如果您配置您的环境。在这种情况下,运行多个仿真可以验证一个训练有素的代理的性能在一个范围的初始条件。

例子:“NumSimulations”, 10

停止仿真一个错误发生时,指定为“关闭”“上”。当这个选项“关闭”、错误捕获和返回的SimulationInfo的输出sim卡,模拟仍在继续。

国旗使用并行仿真,指定为一个逻辑。设置这个选项真正的配置使用并行处理仿真模拟环境,从而使使用多核处理器,计算机集群或云资源加快仿真速度。指定的选项并行仿真,使用ParallelizationOptions财产。

请注意,如果你想加快深层神经网络计算(如梯度计算,参数更新和预测)使用本地GPU你不需要设置UseParallel为true。相反,当创建你的演员或评论家表示,使用一个rlRepresentationOptions对象的UseDevice选项设置为“图形”

使用并行计算或GPU需要并行计算工具箱™软件。另外需要使用计算机集群或云资源MATLAB®并行服务器™

关于培训的更多信息使用多核处理器和gpu,明白了培训代理商使用并行计算和gpu

例子:“UseParallel”,真的

并行化选项来控制并行仿真,指定为一个ParallelTraining对象。培训使用并行计算的更多信息,请参阅强化学习培训代理

ParallelTraining对象具有以下属性,您可以修改后使用点符号创建rlTrainingOptions对象。

随机函数发生器初始化对工人,指定为以下之一:

  • 1——每个工人分配一个唯一的随机种子。种子是工人ID的值。

  • 2——不随机种子分配给员工。

  • 向量-手动为每个工作指定随机种子。向量中的元素的数量必须与工人的数量。

发送模型并行工人和工作空间变量,指定为“上”“关闭”。当选择是“上”中使用,主机发送变量模型和基MATLAB中定义工作空间的工人。

附加文件附加到平行池,指定为一个字符串或字符串数组。

函数运行仿真开始前,指定为一个处理函数没有输入参数。这个函数是在仿真开始前人均运行一次。编写这个函数来执行任何处理之前,你需要模拟。

函数运行仿真结束后,指定为一个处理函数没有输入参数。您可以编写这个函数清理工作区或执行其他处理仿真后终止。

对象的功能

sim卡 模拟训练强化学习代理在指定的环境中

例子

全部折叠

创建一个选项设置为模拟强化学习的环境。设置步骤模拟的数量到1000,三个模拟运行和配置选项。

你可以设置的选项使用名称、值对任何选项,当您创建选项集。你不显式地设置默认值。

simOpts = rlSimulationOptions (MaxSteps = 1000,NumSimulations = 3)
simOpts = rlSimulationOptions属性:MaxSteps: 1000 NumSimulations: 3 StopOnError:”“UseParallel: 0 ParallelizationOptions: [1 x1 rl.option.ParallelSimulation]

另外,创建一个默认的选项设置和使用点符号改变的一些值。

simOpts = rlSimulationOptions;simOpts。MaxSteps= 1000; simOpts.NumSimulations = 3; simOpts
simOpts = rlSimulationOptions属性:MaxSteps: 1000 NumSimulations: 3 StopOnError:”“UseParallel: 0 ParallelizationOptions: [1 x1 rl.option.ParallelSimulation]

版本历史

介绍了R2019a