主要内容

确切的探地雷达法

响应的实例y从一个高斯过程回归(GPR)模型可以建模为

P ( y | f ( x ) , x ) ~ N ( y | h ( x ) T β + f ( x ) , σ 2 )

因此,从探地雷达模型预测新数据要求:

  • 知识的系数向量, β 固定的基函数

  • 能力评估协方差函数 k ( x , x | θ ) 对于任意的 x x ,考虑到内核参数或hyperparameters, θ

  • 噪声方差的知识 σ 2 出现的密度 P ( y | f ( x ) , x )

也就是说,需要一个估计 β , θ , σ 2 从数据 ( X , y )

参数估计

一种方法估计参数 β , θ , σ 2 探地雷达的模型是通过最大化的可能性 P ( y | X ) 的函数 β , θ , σ 2 [1]。也就是说,如果 β ^ , θ ^ , σ ^ 2 的估计是 β , θ , σ 2 分别,那么:

β ^ , θ ^ , σ ^ 2 = arg马克斯 β , θ , σ 2 日志 P ( y | X , β , θ , σ 2 )

因为

P ( y | X ) = P ( y | X , β , θ , σ 2 ) = N ( y | H β , K ( X , X | θ ) + σ 2 n ) ,

边际对数似然函数如下:

日志 P ( y | X , β , θ , σ 2 ) = 1 2 ( y H β ) T ( K ( X , X | θ ) + σ 2 n ] 1 ( y H β ) n 2 日志 2 π 1 2 日志 | K ( X , X | θ ) + σ 2 n |

在哪里 H 是显式的矢量基函数, K ( X , X | θ ) 协方差函数矩阵(有关更多信息,请参见吗高斯过程回归模型)。

估计参数,首先计算的软件 β ^ ( θ , σ 2 ) ,最大化对数似然函数有关 β 对于给定 θ σ 2 。然后使用这个估计计算 β 异形的可能性:

日志 { P ( y | X , β ^ ( θ , σ 2 ) , θ , σ 2 ) }

的估计 β 对于给定 θ , σ 2

β ^ ( θ , σ 2 ) = ( H T ( K ( X , X | θ ) + σ 2 n ] 1 H ] 1 H T ( K ( X , X | θ ) + σ 2 n ] 1 y

然后, β 异形日志可能是由

日志 P ( y | X , β ^ ( θ , σ 2 ) , θ , σ 2 ) = 1 2 ( y H β ^ ( θ , σ 2 ) ) T ( K ( X , X | θ ) + σ 2 n ] 1 ( y H β ^ ( θ , σ 2 ) ) n 2 日志 2 π 1 2 日志 | K ( X , X | θ ) + σ 2 n |

然后最大化的软件 β 异形对数似在 θ , σ 2 发现他们的估计。

预测

从探地雷达进行概率预测模型与已知的参数需要密度 P ( y n e w | y , X , x n e w ) 。使用条件概率的定义,一个可以写:

P ( y n e w | y , X , x n e w ) = P ( y n e w , y | X , x n e w ) P ( y | X , x n e w )

找到联合密度在分子上,有必要引入潜在变量 f n e w f 对应于 y n e w , y ,分别。然后,可以使用的联合分布 y n e w , y , f n e w , f 来计算 P ( y n e w , y | X , x n e w ) :

P ( y n e w , y | X , x n e w ) = P ( y n e w , y , f n e w , f | X , x n e w ) d f d f n e w = P ( y n e w , y | f n e w , f , X , x n e w ) P ( f n e w , f | X , x n e w ) d f d f n e w

高斯过程模型假设每个响应 y 只取决于相应的潜变量 f 和特征向量 x 。写作 P ( y n e w , y | f n e w , f , X , x n e w ) 作为一个产品的条件密度和基于这样的假设:

P ( y n e w , y | f n e w , f , X , x n e w ) = P ( y n e w | f n e w , x n e w ) = 1 n P ( y | f ( x ) , x )

后整合有关 y n e w ,结果只取决于 f X :

P ( y | f , X ) = = 1 n P ( y | f , x ) = = 1 n N ( y | h ( x ) T β + f , σ 2 )

因此,

P ( y n e w , y | f n e w , f , X , x n e w ) = P ( y n e w | f n e w , x n e w ) P ( y | f , X )

再次使用条件概率的定义,

P ( f n e w , f | X , x n e w ) = P ( f n e w | f , X , x n e w ) * P ( f | X , x n e w ) ,

可以写 P ( y n e w , y | X , x n e w ) 如下:

P ( y n e w , y | X , x n e w ) = P ( y n e w | f n e w , x n e w ) P ( y | f , X ) P ( f n e w | f , X , x n e w ) P ( f | X , x n e w ) d f d f n e w

使用的事实

P ( f | X , x n e w ) = P ( f | X )

P ( y | f , X ) P ( f | X ) = P ( y , f | X ) = P ( f | y , X ) P ( y | X ) ,

可以重写 P ( y n e w , y | X , x n e w ) 如下:

P ( y n e w , y | X , x n e w ) = P ( y | X ) P ( y n e w | f n e w , x n e w ) P ( f | y , X ) P ( f n e w | f , X , x n e w ) d f d f n e w

还可以显示

P ( y | X , x n e w ) = P ( y | X )

因此,所需的密度 P ( y n e w | y , X , x n e w ) 是:

P ( y n e w | y , X , x n e w ) = P ( y n e w , y | X , x n e w ) P ( y | X , x n e w ) = P ( y n e w , y | X , x n e w ) P ( y | X ) = P ( y n e w | f n e w , x n e w ) ( 1 ) P ( f | y , X ) ( 2 ) P ( f n e w | f , X , x n e w ) ( 3 ) d f d f n e w

它可以显示

( 1 ) P ( y n e w | f n e w , x n e w ) = N ( y n e w | h ( x n e w ) T β + f n e w , σ n e w 2 )

( 2 ) P ( f | y , X ) = N ( f | 1 σ 2 ( n σ 2 + K ( X , X ) 1 ) 1 ( y H β ) , ( n σ 2 + K ( X , X ) 1 ) 1 )

( 3 ) P ( f n e w | f , X , x n e w ) = N ( f n e w | K ( x n e w T , X ) K ( X , X ) 1 f , Δ ) , 在哪里 Δ = k ( x n e w , x n e w ) K ( x n e w T , X ) K ( X , X ) 1 K ( X , x n e w T )

所需的集成和代数后,密度的新反应 y n e w 在一个新的观点 x n e w ,鉴于 y , X 发现是

P ( y n e w | y , X , x n e w ) = N ( y n e w | h ( x n e w ) T β + μ , σ n e w 2 + Σ ) ,

在哪里

μ = K ( x n e w T , X ) ( K ( X , X ) + σ 2 n ) 1 ( y H β ) α

Σ = k ( x n e w , x n e w ) K ( x n e w T , X ) ( K ( X , X ) + σ 2 n ) 1 K ( X , x n e w T )

预测的期望值 y n e w 在一个新的观点 x n e w 鉴于 y , X 和参数 β , θ , σ 2

E ( y n e w | y , X , x n e w , β , θ , σ 2 ) = h ( x n e w ) T β + K ( x n e w T , X | θ ) α = h ( x n e w ) T β + = 1 n α k ( x n e w , x | θ ) ,

在哪里

α = ( K ( X , X | θ ) + σ 2 n ) 1 ( y H β )

计算复杂度的精确参数估计和预测

培训(当探地雷达模型准确的方法FitMethod“准确”)需要的反演n——- - - - - -n内核矩阵 K ( X , X ) 。这一步的内存要求尺度为O (n2)自 K ( X , X ) 必须存储在内存中。一个评价 日志 P ( y | X ) 尺度为O (n3)。因此,计算复杂度是O (kn3),k是函数的数量最大化和所需的评价n是观测的数量。

新数据做出预测涉及的计算 α ^ 。如果想要预测区间,这一步也可以涉及的柯列斯基因素的计算和存储 ( K ( X , X ) + σ 2 n ) 以备后用。这一步的计算复杂度使用的直接计算 α ^ 是O (n3)和内存需求是O (n2)。

因此,对于大n,参数估计或计算预测可能会非常昂贵。近似计算方法通常涉及重新安排,以避免的反演n——- - - - - -n矩阵。可用近似方法,请参见相关链接在页面的底部。

引用

Rasmussen [1], c, e和c k。威廉姆斯。高斯过程机器学习。麻省理工学院出版社。马萨诸塞州剑桥,2006年。

另请参阅

|

相关的话题