演员或评论家网络的缩放层
缩放层线性缩放输入阵列并使其偏置U
,给出输出Y =。* U +偏见
.你可以将这一层整合到你在强化学习代理中为参与者或批评者定义的深度神经网络中。这一层用于缩放和移动非线性层的输出,例如tanhLayer
和乙状结肠。
例如,一个tanhLayer
给出介于-1和1之间的有界输出。如果您的参与者网络输出有不同的边界(如参与者规范中定义的那样),您可以包括ScalingLayer
作为输出,以适当缩放和移动行动者网络输出。
a的参数ScalingLayer
对象不可学习。