演员或批评网络的缩放层
一种scalinglayer.
是一个深度神经网络层,线性缩放并偏置输入数组你
,给出输出y =比例。* u +偏见
.你可以将这一层纳入到你为强化学习代理中的参与者或批评者定义的深度神经网络中。这一层对于缩放和移动非线性层的输出是有用的,例如Tanhlayer.
和乙状结肠。
例如,一个Tanhlayer.
提供落在-1和1之间的界限输出。如果您的演员网络输出有不同的界限(如演员规范中的定义),则可以包含一个scalinglayer.
作为缩放和换档的输出适当地输出。
a的参数scalinglayer.
对象不是学习的。