主要内容

玛哈尔

Mahalanobis距离

描述

例子

D2=玛哈尔(yX返回平方Mahalanobis距离每个观察y参考样本X

例子

全部收缩

生成相关的双变量样本数据集。

RNG('默认'重复性的%x = mvnrnd([0; 0],[1 .9; .9 1],1000);

指定四个与平均值等距离的观察X在欧几里德距离。

Y = [1 1; 1  -  1; -1 1; -1 -1];

计算每个观察的mahalanobis距离y参考样本X

d2_mahal = mahal(y,x)
d2_mahal =4×11.1095 20.3632 19.5939 1.0137

计算每个观察的平方欧几里德距离y从平均值X

d2_euclidean = sum((y-mean(x))。^ 2,2)
d2_euclidean =4×12.0931 2.0399 1.9625 1.9094

阴谋Xy通过使用分散并使用标记颜色来可视化mahalanobis距离y参考样本X

散射(x(:,1),x(:,2),10,'。'%散射图,尺寸为10抓住散射(y(:,1),y(:,2),100,d2_mahal,'o''填充')HB =彩色杆;Ylabel(HB,'mahalanobis距离') 传奇('X''是''地点''最好的'

图包含轴。轴包含2个类型的散射物体。这些对象代表X,Y。

所有观察y[1,1][-1,-1,][1,-1], 和[-1,1])与平均值等距离X在欧几里德距离。然而,[1,1][-1,-1]比x更靠近x[1,-1][-1,1]在mahalanobis距离。因为mahalanobis距离考虑了数据的协方差和不同变量的尺度,因此它对于检测异常值非常有用。

输入参数

全部收缩

数据,指定为N-经过-m数字矩阵,其中N是观察人数和m是每个观察中的变量数。

Xy必须具有相同数量的列,但可以具有不同的行数。

数据类型:单身的|双倍的

参考样本,指定为aP.-经过-m数字矩阵,其中P.是样品数量和m是每个样本中的变量数。

Xy必须具有相同数量的列,但可以具有不同的行数。X必须具有比列更多的行。

数据类型:单身的|双倍的

输出参数

全部收缩

平方Mahalanobis距离每个观察y参考样本X,返回一个N-1号数字矢量,在哪里N是观察人数X

更多关于

全部收缩

Mahalanobis距离

Mahalanobis距离是样品点和分布之间的衡量标准。

距离矢量的mahalanobis距离y与平均分布μ.和协方差σ.

D. = y - μ. σ. - 1 y - μ. '

这个距离代表了多远y来自标准偏差数量的平均值。

玛哈尔返回平方的mahalanobis距离D.2从观察中y参考样本X。在里面玛哈尔功能,μ.σ.是参考样品的样本均值和协方差。

也可以看看

|

在R2006A之前介绍