主要内容

이번역페이지는최신내용을담고있지않습니다。최신내용을문으로보려면여기를클릭하십시오。

isoutlier

데이터의이상값찾기

설명

예제

特遣部队= isoutlier (一个一个의소에서이상값이발견되면이에대응하는소가真正的논리형배열을반환합니다。기본적으로,이상값이란중앙값에서스케일링된중앙값절대편차(mad)를초과하여떨어져있는값입니다。一个가행렬또는테이블경우isoutlier는열마다별개로동작합니다。一个가다차원배열경우isoutlier는크기가1이아닌첫번째차원에따라동작합니다。

예제

特遣部队= isoutlier (一个方法는이상값을감지하는방법을지정합니다。예를들어,isoutlier (A,“的意思是”)은평균에서3준편차를초과하여떨어져있는모든소에대해真正的를반환합니다。

特遣部队= isoutlier (一个,百分位数,阈值는이상값을阈值에지정된백분위수밖에있는점으로정의합니다。阈值수는백분위수하한임계값및상한임계값을포함하는소를2개가진행벡터(예:[90])입니다。

예제

特遣部队= isoutlier (一个movmethod窗口窗口로정의된윈도우길이에따라국소이상값을감지하는이동방법을지정합니다。예를들어,isoutlier(“movmedian”,5)는5개요소가들어있는슬라이딩윈도우내의국소중앙값에서국소스케일링된3疯狂를초과하여떨어져있는모든요소에대해真正的를반환합니다。

예제

特遣部队= isoutlier (___昏暗的은위에열거된구문을사용하여,一个의 차원昏暗的에대해연산을수행합니다。예를들어,isoutlier (2)는 행렬一个의각행에대해동작합니다。

예제

特遣部队= isoutlier (___名称,值는하나이상의이름——값쌍의인수를사용하여이상값을감지하는추가파라미터를지정합니다。예를들어,isoutlier(“SamplePoints”,t)는시간벡터t의대응소를기준으로一个의이상값을감지합니다。

예제

特遣部队lUC= isoutlier(___는이상값감지방법이사용한하한임계값과상한임계값,그리고중심값도반환합니다。

예제

모두 축소

데이터의벡터에서이상값을찾습니다。출력값의논리값1은이상값의위치를나타냅니다。

A = [57 59 60 100 59 58 57 58 300 61 62 60 62 58 57];TF = isoutlier(A)
TF =1x15逻辑阵列0 0 0 1 0 0 0 1 0 0 0 0 0 0 0

이상값을평균에서3표준편차범위밖에있는점으로정의하고,벡터에서이상값의위치를찾습니다。

A = [57 59 60 100 59 58 57 58 300 61 62 60 62 58 57];TF = isoutlier(A,“的意思是”
TF =1x15逻辑阵列0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0

국소이상값이들어있는데이터의벡터를만듭니다。

X = -2*pi:0.1:2*pi;A = sin(x);A(47) = 0;

一个의데이터에대응하는시간벡터를만듭니다。

t = datetime(2017 1 1 0, 0, 0) +小时(0:长度(x) 1);

이상값을슬라이딩윈도우내국소중앙값에서국소스케일링된3疯狂를초과하여떨어져있는점으로정의합니다。윈도우크기를5시간으로하여t의점을기준으로하여一个에서이상값의위치를찾습니다。데이터와감지된이상값을플로팅합니다。

TF = isoutlier(A,“movmedian”小时(5),“SamplePoints”t);情节(t, t (TF), (TF),“x”)传说(“数据”“离群值”

图中包含一个轴对象。axis对象包含2个line类型的对象。这些对象表示数据、离群值。

행렬의각행에대한이상값을찾습니다。

주대각선상에이상값이있는데이터행렬을만듭니다。

A = magic(5) + diag(200*ones(1,5))
一个=5×5217 24 18 15 23 205 7 14 16 4 6 213 20 22 10 12 19 221 3 11 18 25 2 209

각행의데이터를기반으로이상값의위치를찾습니다。

TF = isoutlier(A,2)
TF =5x5逻辑阵列1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1

이상값이들어있는데이터의벡터를만듭니다。이상값방법으로결정된임계값과중심값,이상값의위치를찾아서플로팅합니다。중심값은데이터의중앙값이며,상한/하한임계값은중앙값으로부터스케일링된3疯狂만큼위그리고아래에있는값입니다。

X = 1:10;A = [60 59 49 49 58 100 61 57 48 58];[TF,L,U,C] = isoutlier(A);情节(x, x (TF), (TF),“x”x L * (10), x, U * (10), x, C *的(10))传说(“原始数据”“离群值”“低门槛”“上阈值”的中心值

图中包含一个轴对象。axis对象包含5个line类型的对象。这些对象表示原始数据、离群值、下限阈值、上限阈值、中心值。

입력marketing수

모두 축소

입력데이터로,벡터,행렬,다차원배열,表형또는时间表형으로지정됩니다。

一个가表형表경우그변수는형 또는형이어야하며,아니면“DataVariables”이름-값쌍을사용하여형 또는형변수를명시적으로나열할수있습니다。또는이아닌데이터형의변수가들어있는테이블을사용하는경우변수를지정하는것이유용합니다。

一个가时间表형경우isoutlier는테이블소에대해서만동작합니다。행시간값은고유해야하며오름차순으로나열되어야합니다。

데이터형:||表格|时间表

이상값감지방법으로,다음중하나로지정됩니다。

방법 설명
“中值” 중앙값에서스케일링된3 mad를초과하여떨어져있는소에대해真正的를반환합니다。스케일링된mad는c *值(abs(中位数(A)))로정의됩니다。여기서c = 1 /(√(2)* erfcinv (3/2))입니다。
“的意思是” 평균에서3준편차를초과하여떨어져있는소에대해真正的를반환합니다。이 방법은“中值”보다빠르지만덜견고합니다。
四分位数的 상위사분위수와하위사분위수에서각각1.5사분위범위를초과해크거나작은요소에대해真正的를반환합니다。이 방법은一个의데이터가정규분포되지않은경우에유용합니다。
“拉布” 가설검정을기반으로이상값1개를매회제거하는그럽스검정(Grubbs测试)을적용합니다。이방법에서는一个의데이터가정규분포된것으로가정합니다。
“gesd” 이상값에대해일반화된극단적스튜던트화이탈(极端Studentized偏离)검정을적용합니다。이반복법은“拉布”와유사하지만,서로를감추는여러이상값이있는경우더효율적일수있습니다。

백분위수임계값으로,요소가구간[0100]에있는요소를2개가진행벡터로지정됩니다。첫번째요소는백분위수하한임계값을나타내고두번째요소는백분위수상한임계값을나타냅니다。예를들어,임계값[90]은이상값을10번째백분위수아래에있는점과90번째백분위수위에있는점으로정의합니다。阈值의첫번째소는두번째소보다작아야합니다。

이상값감지에사용하는이동방법으로,다음중하나로지정됩니다。

방법 설명
“movmedian” 窗口로지정된윈도우길이에걸쳐국소중앙값에서국소스케일링된3疯狂를초과하여떨어져있는요소에대해真正的를반환합니다。이 방법은햄펄 필터라고도합니다。
“movmean” 窗口로지정된윈도우길이에걸쳐국소평균에서3국소표준편차를초과하여떨어져있는요소에대해真正的를반환합니다。

윈도우길이로,양의정수스칼라,양의정수로구성된요소를2개가진벡터,양형의持续时间스칼라또는양형의持续时间으로구성된요소를2개가진벡터로지정됩니다。

窗口가양의정수스칼라경우윈도우는현재소의근지점에중심을두며,窗口1개의접소를가집니다。窗口가짝수이면윈도우의중심은현재소및이전소가됩니다。

窗口가양의정수로구성된소를2개가진벡터f [b]경우윈도우에는현재소,현재소의역방향으로b개소,그리고현재소의정방향으로f개소가들어있습니다。

一个가时间表형이거나“SamplePoints”datetime형 또는持续时间형벡터로지정된경우窗口持续时间형이어야하며,윈도우는샘플점을기준으로하여계산됩니다。

데이터형:||int8|int16|int32|int64|uint8|uint16|uint32|uint64|持续时间

연산을수행할차원으로,양의정수스칼라로지정됩니다。값이지정되지않은경우디폴트값은크기가1이아닌첫번째배열차원이됩니다。

행렬一个가있다고가정합니다。

isoutlier (1)一个의각열에있는데이터에따라이상값을감지합니다。

isoutlier (2)一个의각행에있는데이터에따라이상값을감지합니다。

一个가테이블또는타임테이블이면昏暗的이지원되지않습니다。isoutlier는각테이블변수나타임테이블변수를따라동작합니다。

데이터형:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

이름-값通讯录수

예:isoutlier (A,‘意思’,‘ThresholdFactor’,4)

선택적으로名称,值수가쉼로구분되어지정됩니다。여기서的名字은수이름이고价值는대응값입니다。的名字은따옴。Name1, Value1,…,的家과같이여러개의이름-값쌍의通讯录수를어떤순서로든지정할수있습니다。

데이터옵션

모두 축소

샘플점으로,“SamplePoints”와함께샘플점값으로구성된벡터가쉼표로구분되어지정되거나,또는입력데이터가테이블인경우다음표의옵션과함께구성된쌍이쉼표로구분되어지정됩니다。샘플점은데이터의x축위치를나타내며,이샘플점은정렬되고고유한요소를가져야합니다。샘플점은균일하게샘플링할필가없습니다。벡터[1 2 3…]이디폴트값입니다。

이입력데이터가테이블이면다음옵션중하나를사용하여샘플점을테이블변수로지정할수있습니다。

테이블입력값에대한옵션 설명 예제
변수 이름

단일테이블변수이름을지정하는문자형벡터또는字符串형스칼라

“Var1”

“Var1”

스칼라변수덱스

스칼라테이블변수덱스

3.

논리형벡터

각각의소가테이블변수에해당하는논리형벡터로,여기서真正的는해당하는변수를샘플점으로지정하고다른모든소는로 지정함

[真假假]

함수 핸들

테이블변수를입력값으로받고논리형스칼라를반환하는함수핸들,로하나의테이블변수에대해서만真正的여야 함

@isnumeric

vartype첨자

vartype함수로생성된테이블첨자로하나의변수에대한첨자만반환함

vartype(数字)

참고

입력데이터가时间表형경우에는이이름—값쌍이지원되지않습니다。타임테이블은항상행시간값으로구성된벡터를샘플점으로사용합니다。다른샘플점을사용하려면행시간값이원하는샘플점을포함하도록타임테이블을편집해야합니다。

이동윈도우는샘플점을기준으로정의됩니다。예를들어,t가입력데이터에해당하는시간벡터경우isoutlier(兰德(1 10)“movmean”,3,SamplePoints, t)-1.5 t(我)t(我)+ 1.5범위의시간구간을나타내는윈도우를가집니다。

샘플점벡터의데이터형이datetime형 또는持续时间형경우이동윈도우길이는持续时间형이어야합니다。

예:isoutlier (A ' SamplePoints 0:0.1:10)

예:isoutlier (T,“SamplePoints”,“Var1”)

데이터형:||datetime|持续时间

연산을수행할테이블변수로,“DataVariables”와함께다음` ` `에있는옵션중하나가쉼` ` ` `로구분되어지정됩니다。“DataVariables”값은입력테이블에서이상값이있는지조사할변수를나타냅니다。지정된변수와연결된데이터형은또는이어야합니다。테이블에서“DataVariables”로지정되지않은다른변수는연산이수행되지않으므로출력값은이러한변수에대해값을포함합니다。

옵션 설명 예제
변수 이름

단일테이블변수이름을지정하는문자형벡터또는字符串형스칼라

“Var1”

“Var1”

변수이름으로구성된벡터

각소가테이블변수이름,문자형벡터또는string형배열로구성된셀형배열

{“Var1”“Var2”}

[" Var1”“Var2”)

스칼라또는변수덱스로구성된벡터

스칼라또는테이블변수덱스로구성된벡터

1

[1 3 5]

논리형벡터

각각의소가테이블변수에해당하는논리형벡터。여기서真正的는해당하는변수를포함하고는해당하는변수를제외합니다。

[真真假假]

함수 핸들

테이블변수를입력값으로받고논리형스칼라를반환하는함수핸들

@isnumeric

vartype첨자

vartype함수로생성된테이블첨자

vartype(数字)

예:isoutlier(T,'DataVariables',["Var1" "Var2" "Var4"])

이상값감지옵션

모두 축소

감지임계값marketing자로,“ThresholdFactor”와함께음이아닌스칼라가쉼@ @로구분되어지정됩니다。

“中值”“movmedian”방법의경우감지임계값자가스케일링된mad의개수를대체합니다。디폴트값은3입니다。

“的意思是”“movmean”방법의경우감지임계값자가평균에서벗어난준편차의개수를대체합니다。디폴트값은3입니다。

“拉布”“gesd”방법의경우감지임계값자는0 ~ 1범위의스칼라입니다。값이0에가까우면이상값수가적어지고,값이1에가까우면이상값수가많아집니다。디폴트감지임계값marketing자는0.05입니다。

四分位数的방법의경우감지임계값자가사분위범위의개수를대체합니다。디폴트값은1.5입니다。

이이름-값쌍은지정된방법이百分位数的경우에는지원되지않습니다。

데이터형:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

최대이상값개수로(“gesd”방법만해당),“MaxNumOutliers”와함께양의정수가쉼@ @로구분되어지정됩니다。“MaxNumOutliers”값은“gesd”방법이반환하는최대이상값수를지정합니다。예를들어,isoutlier (A,‘gesd’,‘MaxNumOutliers’,5)는5개이하의이상값을반환합니다。

“MaxNumOutliers”의디폴트값은一个에있는소개수의10%에가장가까운정수입니다。최대이상값수를큰수로설정하면모든이상값이감지되도록할수있지만,계산효율성은떨어집니다。

“gesd”방법은이상값이아닌입력데이터가근사정규분포에서추출된것으로가정합니다。데이터가이러한방식으로추출되지않은경우반환되는이상값의개수는“MaxNumOutliers”값을초과할수있습니다。

데이터형:||int8|int16|int32|int64|uint8|uint16|uint32|uint64

출력marketing수

모두 축소

이상값` ` ` ` `시자로,벡터,행렬또는다차원배열로반환됩니다。特遣部队의소는一个의대응소가이상값이면真正的이고,그렇지않으면입니다。特遣部队의 크기는一个와같습니다。

데이터형:逻辑

이상값감지방법이사용하는하한임계값으로,스칼라,벡터,행렬,다차원배열,테이블또는타임테이블로반환됩니다。예를들어디,폴트이상값감지방법의하한값은입력데이터중앙값에서스케일링된3疯狂아래값입니다。길이가1 rm연산차원을제외한모든차원에서l의 크기는一个와같습니다。

데이터형:||表格|时间表

이상값감지방법이사용하는상한임계값으로,스칼라,벡터,행렬,다차원배열,테이블또는타임테이블로반환됩니다。예를들어디,폴트이상값감지방법의상한값은입력데이터중앙값에서스케일링된3疯狂위값입니다。길이가1 rm연산차원을제외한모든차원에서U의 크기는一个와같습니다。

데이터형:||表格|时间表

이상값감지방법이사용하는중심값으로,스칼라,벡터,행렬,다차원배열,테이블또는타임테이블로반환됩니다。예를들어,디폴트이상값감지방법의중심값은입력데이터의중앙값입니다。길이가1 rm연산차원을제외한모든차원에서C의 크기는一个와같습니다。

데이터형:||表格|时间表

세부 정보

모두 축소

중앙값절대편차

N개의스칼라관측값으로구성된확률변수벡터一에대해,중앙값절대편차(疯狂)는다음과같이정의됩니다。

中位数 | 一个 中位数 一个 |

여기서i = 1,2,…,N입니다。

스케일링된mad는c *值(abs(中位数(A)))로정의됩니다。여기서c = 1 /(√(2)* erfcinv (3/2))입니다。

확장 기능

버전 내역

R2017a에개발됨