거리측정법은은두관측관측간의거리를를정의하는함수Pdist.
는다음과같은다양한거리측정법을지원합니다。유클리드거리,표준화된유클리드거리,마할라노비스거리,도시블록거리,민코프스키거리,체비쇼프거리,코사인거리,상관관계거리,해밍거리,자카드거,리스피어만거리。
m×n데이터터X.
가주어진주어진,이는M(1×N)개행벡터x1,X.2,...,xm으로처리되며,벡터xS.와벡터X.T.간의다양거리는거리는다음과이정의됩니다。
유클리드거리(欧几里德距离)
유클리드거리는p = 2인민코프스키거리의특수한사례입니다。
표준화된유클리드거리
여기V서는j번째대각선요소가(S (j))2인n×n대각행렬입니다(여기는서年代각차원의스케일링인자로구성된벡터임)。
마할라노비스거리
여기서c는공분산행렬입니다。
도시블록거리
도시블록거리는p = 1인민코프스키거리의특수한사례입니다。
민코프스키거리
p = 1인특수한사례에서민코프스키거리는도시블록거리와동일합니다。p = 2인특수한사례에서민코프스키거리는유클리드거리와합니다。p =∞인특수한사례에서에서민코프스키거리는체비쇼프거리와동일
체비쇼프거리
체비쇼프거리는p =∞인민코프스키거리의특수한사례입니다。
코사인인
상관관계거리
여기서는다음을조건합니다합니다。
이고
입니다。
해밍거리(汉明距离)
자카드거리(Jaccard距离)
스피어만거리(枪兵的距离)
여기서는다음을조건합니다합니다。
R.SJ.는x1j,X.2j, ...X.MJ.에대해얻은xSJ.의순위로,tiedrank
에의해계산됩니다。
R.S.및r.T.는xS.와X.T.로구성된좌표별순위벡터입니다。즉rS.=(r.S.1,R.S.2, ...R.桑)입니다。
。
。