主要内容

神经网络架构

前面展示的两个或多个神经元可以组合在一个层中,一个特定的网络可以包含一个或多个这样的层。首先考虑单层神经元。

一层神经元

一个单层网络R输入元素和年代神经元。

在这个网络中,输入向量的每个元素p连接到每个神经元输入通过权重矩阵W.的该神经元有一个夏天,收集其加权输入和偏差,以形成自己的标量输出n).各种各样的n)合在一起形成一个年代-element净输入向量n.最后,神经元层输出形成一个列向量一个.的表达式一个如图底部所示。

请注意,一层的输入数量通常与神经元的数量不同(即,R不一定等于年代).一个层不受限制,它的输入数量等于它的神经元数量。

你可以通过简单地将前面展示的两个网络并行放置来创建具有不同传递函数的单个(复合)神经元层。两个网络都有相同的输入,每个网络都会产生一些输出。

输入向量元素通过权值矩阵进入网络W

W w 1 1 w 1 2 ... w 1 R w 2 1 w 2 2 ... w 2 R w 年代 1 w 年代 2 ... w 年代 R

注意矩阵元素上的行下标W指示权重的目标神经元,列索引指示哪个源是该权重的输入。因此,在w1、2比如信号的强度第二个输入元素第一个(也是唯一的)神经元是w1、2

年代神经元R-input一层网络也可以用缩写表示。

在这里p是一个R-length输入向量W是一个年代×R矩阵,一个而且b年代长度的向量。如前所述,神经元层包括权重矩阵、乘法运算和偏置向量b夏季和传递函数块。

输入和层

为了描述具有多层的网络,必须对表示法进行扩展。具体来说,它需要区分连接到输入的权重矩阵和连接到层之间的权重矩阵。它还需要确定权重矩阵的源和目标。

我们称权重矩阵与输入相连nput权重;我们将调用与层输出相连的权重矩阵l艾耶尔权重。此外,上标用于标识网络中各种权重和其他元素的源(第二个索引)和目标(第一个索引)。为了说明,这里以缩写形式重新绘制了前面所示的单层多输入网络。

如你所见,权重矩阵连接到输入向量p标记为输入权重矩阵(信息战1, - 1),具有源1(第二个索引)和目标1(第一个索引)。第1层的元素,比如它的偏置、净输入和输出都有一个上标1,表示它们与第1层相关联。

多层神经元使用层权重(LW)矩阵,以及输入权重(信息战)矩阵。

多层神经元

一个网络可以有几个层。每一层都有一个权重矩阵W,偏置向量b,和输出向量一个.为了区分权重矩阵、输出向量等,对于图中的每一层,层数作为上标附加到感兴趣的变量。你可以看到这个图层的使用接下来显示的三层网络中的符号,以及图底部的方程中的符号。

上面显示的网络已经R1输入,年代1第一层的神经元,年代2第二层的神经元等等。不同的层有不同数量的神经元是很常见的。每个神经元的偏置输入为常数1。

注意,每个中间层的输出都是下一层的输入。因此,第2层可以被分析为单层网络年代1输入,年代2神经元和一个年代2×年代1权重矩阵W2.第2层的输入是一个1;输出为一个2.现在第2层的所有向量和矩阵都已经被识别出来了,它可以被看作是一个单独的单层网络。这种方法可以用于网络的任何层。

多层网络的各个层起着不同的作用。产生网络输出的层称为输出层.调用所有其他层隐藏层.前面所示的三层网络有一个输出层(第3层)和两个隐藏层(第1层和第2层)。一些作者将输入层称为第4层。这个工具箱不使用这个名称。

具有单一输入向量的多层网络的体系结构可以用表示法指定R年代1年代2−−…年代,其中指定输入向量的元素数量和每层神经元的数量。

同样的三层网络也可以用缩写符号来画。

多层网络非常强大。例如,一个两层的网络,其中第一层是sigmoid,第二层是线性的,可以被训练成任意地近似任何函数(具有有限数量的不连续)。这种二层网络被广泛应用于多层浅层神经网络与反向传播训练

这里假设第三层的输出,一个3.,是感兴趣的网络输出,该输出被标记为y.此符号用于指定多层网络的输出。

输入输出处理函数

网络输入可能具有相关的处理功能。处理函数将用户输入数据转换为对网络更容易或更有效的形式。

例如,mapminmax转换输入数据,使所有值都落入区间[−1,1]。这可以加快许多网络的学习速度。removeconstantrows删除输入向量中与总是具有相同值的输入元素相对应的行,因为这些输入元素没有向网络提供任何有用的信息。第三个常见的处理函数是fixunknowns,它重新编码未知数据(在用户数据中用值)转换为网络的数值形式。fixunknowns保存关于哪些值已知,哪些值未知的信息。

类似地,网络输出也可以具有相关的处理函数。输出处理函数用于转换用户提供的目标向量以供网络使用。然后,使用相同的函数对网络输出进行反向处理,以产生与原始用户提供的目标具有相同特征的输出数据。

这两个mapminmax而且removeconstantrows通常与网络输出相关。然而,fixunknowns不是。目标中的未知值(由值)不需要为网络使用而更改。

处理功能将在选择神经网络输入输出处理函数

相关的话题