探地雷达模型回归量的子集逼近
回归量子集逼近法由替换核函数组成
在精确探地雷达法通过它的近似
,给定活动集合
.属性为参数估计指定SR方法“FitMethod”、“老”
调用中的名称-值对参数fitrgp
.对于使用SR进行预测,可以使用“PredictMethod”、“老”
调用中的名称-值对参数fitrgp
.
逼近核函数
为精确的探地雷达模型, GPR中的预期预测取决于的集合 功能 ,在那里 所有观测值的指标集,和n是观测的总数。这个想法是用一个更小的函数集来近似这些函数张成的空间, ,在那里 是被选为活动集中的点的索引的子集。考虑 .目的是近似地计算元素 元素的线性组合 .
假设近似为 使用中的函数 如下:
在哪里 线性组合的系数是否近似 .假设 矩阵包含所有系数吗 .然后, ,是一个 这样的矩阵 .软件会找到与元素的最佳近似 使用活动集 通过最小化误差函数
在哪里 再现核希尔伯特空间(RKHS)与核函数有关吗k[1],[2].
最小的系数矩阵 是
用活动集中的元素近似核函数 是
利用活动集对核函数进行SR近似 定义为:
和SR近似 是:
参数估计
替换 通过 在边缘对数似然函数中产生其SR近似:
就像确切的方法时,软件通过先计算来估计参数 的最优估计 ,鉴于 而且 .然后估计 , 使用 -剖面边缘对数似然。SR估计为 对于给定 , 是:
在哪里
还有SR的近似 -剖面边际对数似然为:
预测
分布的SR近似 鉴于 , , 是
在哪里 而且 SR近似是 而且 所示使用精确的探地雷达方法进行预测.
而且 都是通过替换 根据其SR近似 在 而且 ,分别。
也就是说,
自
从事实来看 , 可以写成
同样的, 推导如下:
因为
得到如下:
预测方差问题
SR方法的缺点之一是,当在远离所选活动集的区域进行预测时,它可以给出不合理的小预测方差 .考虑在一个新的点上做一个预测 这离训练集很远 .换句话说,假设 .
对于精确探地雷达,后验分布 鉴于 , 而且 是正常的还是刻薄的 和方差 .这个值是正确的,因为,如果 远远不是 ,然后是数据 没有提供任何新的信息关于 所以后验分布 鉴于 , , 应该归为先验分布吗 鉴于 ,为带均值的正态分布 和方差 .
对于SR近似,如果 是远离 (因此也远离 ),然后 而且 .因此在这种极端情况下, 同意 精确的探地雷达,但是 小到不合理 精确的探地雷达。
的完全独立条件近似法可以帮助避免这个问题。
参考文献
[1]拉斯穆森,c.e.和c.k.i.威廉姆斯。机器学习的高斯过程。麻省理工学院出版社。剑桥,马萨诸塞州,2006年。
[2]斯莫拉,a.j., B. Schökopf。“机器学习的稀疏贪婪矩阵近似。”在第十七届机器学习国际会议论文集, 2000年。