GPR模型的回归器近似值
这subset of regressors (SR) approximation method consists of replacing the kernel function
在the精确的GPR方法经过一世ts approximation
,给定活动集
。您可以使用使用方法为参数估计指定SR方法'FitMethod','sr'
呼叫中的名称值对参数Fitrgp.
。对于使用SR预测,您可以使用'predictmethod','sr'
呼叫中的名称值对参数Fitrgp.
。
近似内核函数
为了精确的GPR模型,GPR中的预期预测取决于该组 职能 , 在哪里 是所有观察结果的一组索引N.是the total number of observations. The idea is to approximate the span of these functions by a smaller set of functions, , 在哪里 是选择为活动集中的点指数的子集。考虑 。目的是近似的元素 作为线性组合的元素 。
认为the approximation to 使用功能 如下:
在哪里 是近似线性组合的系数 。认为 是包含所有系数的矩阵 。这N.那 ,是A. 矩阵这样 。该软件发现对元素的最佳近似值 using the active set 通过最小化误差函数
在哪里 是与内核函数相关联的再现内核希尔伯特空格(RKHS)K.[1]那[2]。
最小化的系数矩阵 是
使用活动集中的元素到内核函数的近似值 是
这S.R.approximation to the kernel function using the active set 被定义为:
和sr近似 是:
P.arameter Estimation
更换 经过 在边缘日志中,似然函数产生其SR近似值:
就像在那样确切的方法,软件通过第一计算估计参数 ,最佳估计 给定 and 。这N.一世t estimates 那and using the -profiled marginal log likelihood. The SR estimate to 给予 那and 是:
在哪里
一种N.d the SR approximation to the - 纯粹的边缘日志可能是:
预言
SR近似到分布 给予 那 那 是
在哪里 and 是sr近似值 and 显示在使用精确的GPR方法预测。
and 通过更换获得 经过一世ts SR approximation 在 and , 分别。
那是,
S.一世N.CE.
从这个事实中 那 可以写成
S.一世milarly, 是derived as follows:
因为
是Found as follows:
预测方差问题
One of the disadvantages of the SR method is that it can give unreasonably small predictive variances when making predictions in a region far away from the chosen active set 。考虑在新点进行预测 that is far away from the training set 。换句话说,假设 。
对于精确的GPR,后部分布 给予 那 and 与平均值是正常的 and variance 。T.H一世s value is correct in the sense that, if 远离 ,然后是数据 不提供有关的任何新信息 所以后部分布 给予 那 那and 应该减少到先前的分销 给予 ,这是一种正常分布,平均值 and variance 。
对于SR近似,如果 是Far away from (因此也很远 ), 然后 and 。因此在这个极端情况下, 同意 来自精确的GPR,但是 是unreasonably small compared to 从精确的GPR。
这完全独立的条件近似方法可以帮助避免这个问题。
R.E.FE.R.E.N.CE.s
[1]R.asmussen, C. E. and C. K. I. Williams.高斯机器学习过程。MIT Press。剑桥,马萨诸塞州,2006年。
[2] Smola,A. J.和B.Schökopf。“机器学习的稀疏贪婪矩阵近似”。在第十七届国际机器学习会议的诉讼程序,2000年。