主要内容

이번역페이지는최신내용을담고있지않습니다。최신내용을영문으로보려면여기를클릭하십시오。

Pdist.

관측관측값쌍간의(成对)거리

설명

예제

D.= pdist(X.X.에포함된된관측값값간의유클리드거리거리를반환반환

예제

D.= pdist(X.距离距离로지정된방법을사용하여거리를반환합니다。

예제

D.= pdist(X.距离distparameter.距离distparameter.로지정된방법을사용하여거리를반환합니다。距离$'seuclidean''minkowski'또는“mahalanobis”인경우에만distparameter.를지정할수있습니다。

예제

모두축소

관측값쌍간의유클리드거리를계산하고squareform을사용하여거리벡터를행렬로변환합니다。

세개의관측값과두개의변수를갖는행렬을생성합니다。

rng (“默认”%的再现性X =兰德(3 2);

유클리드거리를계산합니다。

D = pdist (X)
D =1×30.2954 1.0670 0.9448

쌍별(成对)거리가인덱스(2,1)、(1),(2)에배열됩니다。squareform을사용하여하여관측와관측값j간의거리를쉽게확인할수있습니다。

Z = squareform (D)
z =3×30 0.2954 1.0670 0.2954 0 0.9448 1.0670 0.9448 0

squareform은대칭행렬을반환합니다。이대칭행렬에서Z (i, j)는관측값j간의쌍별거리를나타냅니다。예를들어,관측값2와관측값3간의거리를구할수있습니다。

Z(2,3)
ans = 0.9448.

Z.squareform함수에전달하여Pdist.함수의출력값을합니다합니다。

Y = SquareForm(Z)
y =1×30.2954 1.0670 0.9448

squareform의출력값yPdist.의출력값D.는같습니다。

세개의관측값과두개의변수를갖는행렬을생성합니다。

rng (“默认”%的再现性X =兰德(3 2);

2디폴트지수를사용하여민코프스키거리를계산합니다。

d1 = pdist(x,'minkowski'
D1 =1×30.2954 1.0670 0.9448

지수로1을사용하여거리거리를합니다。이는도시도시블록거리와。

D2 = pdist (X,'minkowski',1)
D2 =1×30.3721 1.5036 1.3136
d3 = pdist(x,'CityBlock'
D3 =1×30.3721 1.5036 1.3136

이사하는이사용자지정함수를사용하여쌍별를계산합니다。

세개의관측값과두개의변수를갖는행렬을생성합니다。

rng (“默认”%的再现性X =兰德(3 2);

첫번째관측값의첫번째요소가결측결측고가정합니다。

X(1,1) =南;

유클리드거리를계산합니다。

d1 = pdist(x)
D1 =1×3南南0.9448

관측값또는관측값j$값을포함하는경우함수Pdist.j간의쌍별거리로을반환합니다。따라서,D1(1)및D1(2),즉쌍별거리(2,1)및은(3,1)값입니다。

값을갖는좌표를무시하는사용자지정거리함수nanyucdist.를정의하고유클리드거리를반환합니다。

功能D2 = naneucdist (XI, XJ)%Naneucdist欧几里德距离忽略与NAN的坐标n =大小(XI, 2);sqdx = (xi xj) ^ 2;nstar =总和(~ isnan (sqdx), 2);%不包含NAN的成对数nstar(nstar == 0)= nan;%如果所有对都包含NaN,则返回NaNd2squared = sum(sqdx,2,'omitnan')。* n./nstar;%修正缺失的坐标D2 =√D2squared);

nanyucdist.를사용하고Pdist.의입력인수로함수핸들을전달하여거리를계산합니다。

d2 = pdist(x,@ naneucdist)
D2 =1×30.3974 1.1538 0.9448

입력인수

모두축소

입력데이터로,크기가m×n인행렬로지정됩니다。행은개별관측값에대응,열은개별변수에대응。

데이터형:单身|

거리측정법으로,다음표에설명된대로벡터,弦형스칼라또는함수핸들로됩니다됩니다됩니다。

설명
'euclidean'

유클리드거리입니다(디폴트값)。

'squareduclidean'

제곱유클리드거리입니다。(이옵션은효율성을위해서만제공됩니다。삼각부등식을충족하지않습니다。)

'seuclidean'

표준화된유클리드거리입니다。관측값간의각좌표좌표이는표준편차s = std(x,'omitnan')의대응요소로나누어져됩니다됩니다。S.에에대해다른값값을지정distparameter.를사용하십시오。

“mahalanobis”

X.의표본공분산C = COV(x,'omitrows')를사용하는마할라노비스거리입니다。C.에에대해다른값값을지정distparameter.를사용하십시오。여기서행렬C.는양의정부호대칭입니다입니다。

'CityBlock'

도시블록거리입니다。

'minkowski'

민코프스키민코프스키입니다。디폴트지수는2입니다。다른지수P.를지정하려면distparameter.를사용하십시오。여기서P.는지수의양의스칼라값입니다。

'chebbychev'

체비쇼프거리(최대좌표차이)입니다。

'余弦'

1에서점점간의끼인각에사인을을값입니다(벡터로벡터로됨)。

“相关”

1)에서점간의표본상관을뺀값입니다(일련의값으로처리됨)。

'汉明'

해밍거리로,서로다른좌표의비율。

“jaccard”

1에서서로다른,0이아닌아닌좌표의백분율인자카드를뺀값값카드를뺀값값카드를뺀값값값를뺀값값

“矛曼”

1)에서관측값간표본스피어만의순위상관계수를뺀값입니다(일련의값으로처리됨)。

@DISTFUN

使用方法지정핸들입니다。거리함수의형식은같습니다같습니다。

功能d2 = distfun(zi,zj)%计算距离......
여기서

  • 는단일관측값을포함하는1×N벡터입니다。

  • ZJ는여러관측값을포함하는M2×N행렬입니다。DISTFUN은임의개수의관측값을갖는행렬ZJ를를합니다。

  • D2는거리로구성된M2×1벡터이고,D2 (k)는관측값ZJ (k,:)간의거리입니다。

데이터가희소가아닌경우일반적으로함수핸들대신내장거리함수를사용하면더욱신속하게거리를계산할수있습니다。

정의는거리측정법항목을참조하십시오。

'seuclidean''minkowski'또는“mahalanobis”를사용하는하는,입력인수distparameter.를가로지정하여하여이러한측정법측정법을제어제어할수수distparameter.의디폴트값을사용다른다른같은방식으로이러한측정법을사용할수도있습니다있습니다。

예:'minkowski'

거리측정법파라미터값으로,양의스칼라,숫자형벡터또는숫자형행렬로지정됩니다。이인수는距离'seuclidean''minkowski'또는“mahalanobis”로로지정하는경우경우에만유효유효

  • 距离$'seuclidean'이면distparameter.는는차원에대한인자로구성된벡터이며양의벡터로지정됩니다。디폴트값은std(x,'omitnan')입니다。

  • 距离$'minkowski'이면distparameter.는민코프스키거리의지수이며양의스칼라로지정。디폴트값은2입니다。

  • 距离$“mahalanobis”이면distparameter.는공분산행렬이며숫자형행렬로지정됩니다。디폴트값은X (X, omitrows)입니다。distparameter.는는의정부호대칭행렬이어야합니다。

예:'Minkowski',3

데이터형:单身|

출력인수

모두축소

쌍별(成对)거리로,관측값쌍에대응되는길이가m (m - 1) / 2인숫자형행벡터로반환됩니다。은여기서米X.에에포함된관측관측값의개수개수

△(2,1),(3,1),...,(m,1),(3,2),...,(m,2),...,(m,m-1),즉m×m거리행렬의아래아래부분이열순서대로배열됩니다。관측값i와관측값j간의쌍별거리는我≤j.에대해d((i-1)*(m-i / 2)+ j-i)로정의됩니다。

squareform함수를사용용D.를대칭행렬로변환할있습니다있습니다。Z = squareform (D)는m×m행렬을반환합니다。여기서Z (i, j)는관측값i와관측값값값의쌍별거리를나타냅니다。

내장거리함수의경우,관측값我나관측값j가을포함하면D.의대응값은이됩니다。

D.는는군집화또는다차원다차원스케일링사성행렬로주로사용됩니다。자세한내용은계층적군집화항목과cmdscaleCOPHENET.联系mdscale.OptimAlleafOrder.의함수도움말페이지를를참조。이들함수는.D.를입력인수로받습니다。

세부정보

모두축소

거리측정법

거리측정법은은두관측관측간의거리를를정의하는함수Pdist.는다음과같은다양한거리측정법을지원합니다。유클리드거리,표준화된유클리드거리,마할라노비스거리,도시블록거리,민코프스키거리,체비쇼프거리,코사인거리,상관관계거리,해밍거리,자카드거,리스피어만거리。

m×n데이터터X.가주어진주어진,이는M(1×N)개행벡터x1,X.2,...,xm으로처리되며,벡터xS.와벡터X.T.간의다양거리는거리는다음과이정의됩니다。

  • 유클리드거리(欧几里德距离)

    D. S. T. 2 = X. S. - X. T. X. S. - X. T. '

    유클리드거리는p = 2인민코프스키거리의특수한사례입니다。

  • 표준화된유클리드거리

    D. S. T. 2 = X. S. - X. T. V. - 1 X. S. - X. T. '

    여기V서는j번째대각선요소가(S (j))2인n×n대각행렬입니다(여기는서年代각차원의스케일링인자로구성된벡터임)。

  • 마할라노비스거리

    D. S. T. 2 = X. S. - X. T. C. - 1 X. S. - X. T. '

    여기서c는공분산행렬입니다。

  • 도시블록거리

    D. S. T. = σ. j = 1 N | X. S. j - X. T. j |

    도시블록거리는p = 1인민코프스키거리의특수한사례입니다。

  • 민코프스키거리

    D. S. T. = σ. j = 1 N | X. S. j - X. T. j | P. P.

    p = 1인특수한사례에서민코프스키거리는도시블록거리와동일합니다。p = 2인특수한사례에서민코프스키거리는유클리드거리와합니다。p =∞인특수한사례에서에서민코프스키거리는체비쇼프거리와동일

  • 체비쇼프거리

    D. S. T. = 最大 j { | X. S. j - X. T. j | }

    체비쇼프거리는p =∞인민코프스키거리의특수한사례입니다。

  • 코사인인

    D. S. T. = 1 - X. S. X. ' T. X. S. X. ' S. X. T. X. ' T.

  • 상관관계거리

    D. S. T. = 1 - X. S. - X. ¯ S. X. T. - X. ¯ T. ' X. S. - X. ¯ S. X. S. - X. ¯ S. ' X. T. - X. ¯ T. X. T. - X. ¯ T. '

    여기서는다음을조건합니다합니다。

    X. ¯ S. = 1 N σ. j X. S. j 이고 X. ¯ T. = 1 N σ. j X. T. j 입니다。

  • 해밍거리(汉明距离)

    D. S. T. = X. S. j X. T. j / N

  • 자카드거리(Jaccard距离)

    D. S. T. = [ X. S. j X. T. j X. S. j 0. X. T. j 0. ] [ X. S. j 0. X. T. j 0. ]

  • 스피어만거리(枪兵的距离)

    D. S. T. = 1 - R. S. - R. ¯ S. R. T. - R. ¯ T. ' R. S. - R. ¯ S. R. S. - R. ¯ S. ' R. T. - R. ¯ T. R. T. - R. ¯ T. '

    여기서는다음을조건합니다합니다。

    • R.SJ.는x1j,X.2j, ...X.MJ.에대해얻은xSJ.의순위로,tiedrank에의해계산됩니다。

    • R.S.및r.T.는xS.와X.T.로구성된좌표별순위벡터입니다。즉rS.=(r.S.1,R.S.2, ...R.)입니다。

    • R. ¯ S. = 1 N σ. j R. S. j = N + 1 2

    • R. ¯ T. = 1 N σ. j R. T. j = N + 1 2

확장기능

R2006A이전에개발개발