GPR模型的回归器近似子集
回归器(SR)近似方法的子集包括替换内核函数
在里面精确的GPR方法通过近似
,给定活动集
。您可以使用“ fitMethod”,'sr'
呼叫中的名称值对参数fitrgp
。对于使用SR的预测,您可以使用“预测方法”,“ sr'
呼叫中的名称值对参数fitrgp
。
近似内核函数
为了确切的GPR模型,GPR中的预期预测取决于 功能 , 在哪里 是所有观察的索引集,n是观察总数。这个想法是通过较小的函数集近似这些函数的跨度, , 在哪里 是选择为活动集中的点的索引子集。考虑 。目的是近似 作为元素的线性组合 。
假设近似 在 如下:
在哪里 是线性组合的系数用于近似 。认为 是包含所有系数的矩阵 。然后, ,是 矩阵这样 。该软件找到了与元素的最佳近似 使用活动集 通过最小化错误函数
在哪里 是与内核功能相关的繁殖内核希尔伯特空间(RKHS)k[1],,,,[2]。
最小化系数矩阵 是
并使用活动集中的元素与内核函数进行近似 是
使用活动集的SR近似与内核函数 被定义为:
和SR近似 是:
参数估计
更换 经过 在边际对数可能性函数中,产生其SR近似:
就像在精确的方法,该软件通过首先计算来估计参数 ,最佳估计 ,给予 和 。然后估计 , 和 使用 - 填充的边缘原木可能性。SR估计 给定 , 和 是:
在哪里
和SR近似 - 填充的边缘日志可能性是:
预言
SR分布的SR近似 给出 ,,,, ,,,, 是
在哪里 和 是SR近似 和 显示在使用精确的GPR方法进行预测。
和 通过更换获得 通过其SR近似 在 和 , 分别。
那是,
自从
从事实上 ,,,, 可以写成
相似地, 得出如下:
因为
被发现如下:
预测差异问题
SR方法的缺点之一是,在远离所选活动集的区域中进行预测时,它可以给出不合理的小预测差异 。考虑在新点进行预测 离训练集很远 。换句话说,假设 。
对于精确的GPR,后验分布 给出 ,,,, 和 平均是正常的 和差异 。从某种意义上说,这个值是正确的 离得很远 ,然后数据 不提供有关有关的任何新信息 因此 给出 ,,,, , 和 应减少到先前的分布 给出 ,这是平均分布 和差异 。
对于SR近似,如果 远离 (因此也很远 ), 然后 和 。因此,在这种极端情况下 同意 从确切的GPR,但 与 来自精确的GPR。
这完全独立的条件近似法可以帮助避免这个问题。
参考
[1] Rasmussen,C。E.和C. K. I. Williams。用于机器学习的高斯流程。麻省理工学院出版社。剑桥,马萨诸塞州,2006年。
[2] Smola,A。J.和B.Schökopf。“机器学习的稀疏贪婪矩阵近似。”在第十七国际机器学习会议论文集,2000年。