主要内容

泰姬陵

而距离参考样本

描述

例子

d2=泰姬陵(Y,X)返回的平方Mahalanobis距离每个观测的Y在参考的样品X

例子

全部折叠

生成一个二元相关样本数据集。

rng (“默认”)%的再现性X = mvnrnd ((0, 0), [1。9;。9 1],1000);

指定四种观测等距的意思X在欧氏距离。

Y = [1 1; 1 1; 1 1; 1 1];

计算每个观测的距离Y在参考的样品X

d2_mahal =泰姬陵(Y, X)
d2_mahal =4×11.1095 20.3632 19.5939 1.0137

计算每个观测的平方欧氏距离Y的意思是X

d2_Euclidean =总和((Y-mean (X)) ^ 2, 2)
d2_Euclidean =4×12.0931 2.0399 1.9625 1.9094

情节XY通过使用散射并使用标记颜色可视化的距离Y在参考的样品X

散射(X (: 1) X(:, 2), 10日“。”)%散点图的大小10持有散射(Y (: 1), Y(:, 2), 100年,d2_mahal,“o”,“填充”)hb = colorbar;ylabel (hb,“Mahalanobis距离”)传说(“X”,“Y”,“位置”,“最佳”)

图包含一个坐标轴对象。坐标轴对象包含2散射类型的对象。这些对象代表X, Y。

所有的观察Y([1],[1],[1],[1])是等距的意思X在欧氏距离。然而,[1][1]更接近X比吗[1][1]在距离。因为Mahalanobis距离考虑数据的协方差和不同的尺度变量,它是用于检测离群值。

输入参数

全部折叠

数据,指定为一个n——- - - - - -数字矩阵,n是观察和的数量吗是每一个观测变量的数量。

XY必须有相同数量的列,但可以有不同数量的行。

数据类型:|

参考样品,指定为一个p——- - - - - -数字矩阵,p的样品和数量吗是变量的数量在每个样本。

XY必须有相同数量的列,但可以有不同数量的行。X一定比列的行。

数据类型:|

输出参数

全部折叠

的平方Mahalanobis距离每个观测的Y在参考的样品X,作为一个返回n1数字向量,n观察的数量吗X

更多关于

全部折叠

Mahalanobis距离

Mahalanobis距离是衡量样本点和分布。

的距离向量y与的意思是一个分布μ和协方差Σ

d = ( y μ ) 1 ( y μ )

这个距离是多远y从标准差的平均数量。

泰姬陵返回的平方距离d2从一个观察Y在参考的样品X。在泰姬陵函数,μΣ是样本均值和协方差的参考样本,分别。

版本历史

之前介绍过的R2006a