进口政策和价值函数表示- MATLAB和Simulink金宝app - 金宝app,下载188bet金宝搏,金宝搏官方网站

导入策略和价值功能交涉

要创建用于强化学习的函数逼近器，您可以使用deep learning Toolbox™网络导入功能导入预训练的深度神经网络或深度神经网络层架构。你可以导入:

开放式神经网络交换（ONNX™）模式，这需要深入学习工具箱转换为ONNX模型格式支持软件包。金宝app了解更多信息，importONNXLayers。
keras网络，它需要深度学习工具箱进口商为TensorFlow，Keras模型金宝app支持包软件。有关更多信息，请参见importKerasLayers。
朱古力卷积网络，这需要用于Caffe模型的深度学习工具箱导入器金宝app支持包软件。有关更多信息，请参见importCaffeLayers。

导入一个深层神经网络之后,您可以创建一个策略或价值函数表示对象使用表示对象,如rlValueRepresentation。

当您导入深度神经网络架构时，请考虑以下问题。

有关强化学习支持的深度神经网络架构的更多信息，请参见金宝app创建策略和价值函数表示。

例如，假设您有一个具有50×50灰度图像观察信号和连续动作空间的环境。要训练策略梯度代理，需要以下函数逼近器，它们都必须有单个50×50图像输入观察层和单个标量输出值。

另外，假设您有以下网络架构需要导入:

要导入评论家和演员的网络，使用importONNXLayers函数不指定一个输出层。

criticNetwork = importONNXLayers ('criticNetwork.onnx');actorNetwork = importONNXLayers ('actorNetwork.onnx');

这些命令生成警告，其中指出，直到加入的输出层中的网络是可训练。当您使用导入的网络创建一个演员或评论家表示，强化学习工具箱™软件会自动为你增加一个输出层。

导入网络之后，创建actor和批评家函数近似器表示。要做到这一点，首先要从环境中获取观察和行动规范。

obsInfo = getObservationInfo (env);actInfo = getActionInfo (env);

创建评论家表示，指定评论家网络作为观察名的输入层的名称。由于评论家网络具有单一观察输入和单个动作输出，使用一个值的功能的表示。

评论家= rlValueRepresentation (criticNetwork obsInfo,…“观察”{criticNetwork.Layers（1）请将.Name}）;

创建actor表示，指定actor网络的输入层的名称作为观察名称，并指定actor网络的输出层作为观察名称。由于actor网络具有单个标量输出，因此使用确定性actor表示。

演员= rlDeterministicActorRepresentation (actorNetwork obsInfo actInfo,…“观察”{actorNetwork.Layers（1）请将.Name}…'行动'{actorNetwork.Layers（端部），请将.Name}）;

然后,您可以:

下载电子书