이번역페이지는최신내용을담고있지않습니다。최신내용을문으로보려면여기를클릭하십시오。
isoutlier
데이터의이상값찾기
구문
설명
는特遣部队
= isoutlier (一个
)一个
의소에서이상값이발견되면이에대응하는소가真正的
논리형배열을반환합니다。기본적으로,이상값이란중앙값에서스케일링된중앙값절대편차(mad)를초과하여떨어져있는값입니다。一个
가행렬또는테이블경우isoutlier
는열마다별개로동작합니다。一个
가다차원배열경우isoutlier
는크기가1이아닌첫번째차원에따라동작합니다。
예제
벡터의이상값감지하기
데이터의벡터에서이상값을찾습니다。출력값의논리값1은이상값의위치를나타냅니다。
A = [57 59 60 100 59 58 57 58 300 61 62 60 62 58 57];TF = isoutlier(A)
TF =1x15逻辑阵列0 0 0 1 0 0 0 1 0 0 0 0 0 0 0
평균을사용하여이상값감지하기
이상값을평균에서3표준편차범위밖에있는점으로정의하고,벡터에서이상값의위치를찾습니다。
A = [57 59 60 100 59 58 57 58 300 61 62 60 62 58 57];TF = isoutlier(A,“的意思是”)
TF =1x15逻辑阵列0 0 0 0 0 0 0 0 1 0 0 0 0 0 0 0
슬라이딩윈도우로이상값감지하기
국소이상값이들어있는데이터의벡터를만듭니다。
X = -2*pi:0.1:2*pi;A = sin(x);A(47) = 0;
一个
의데이터에대응하는시간벡터를만듭니다。
t = datetime(2017 1 1 0, 0, 0) +小时(0:长度(x) 1);
이상값을슬라이딩윈도우내국소중앙값에서국소스케일링된3疯狂를초과하여떨어져있는점으로정의합니다。윈도우크기를5시간으로하여t
의점을기준으로하여一个
에서이상값의위치를찾습니다。데이터와감지된이상값을플로팅합니다。
TF = isoutlier(A,“movmedian”小时(5),“SamplePoints”t);情节(t, t (TF), (TF),“x”)传说(“数据”,“离群值”)
데이터행렬
행렬의각행에대한이상값을찾습니다。
주대각선상에이상값이있는데이터행렬을만듭니다。
A = magic(5) + diag(200*ones(1,5))
一个=5×5217 24 18 15 23 205 7 14 16 4 6 213 20 22 10 12 19 221 3 11 18 25 2 209
각행의데이터를기반으로이상값의위치를찾습니다。
TF = isoutlier(A,2)
TF =5x5逻辑阵列1 0 0 0 0 0 1 0 0 0 0 0 1 0 0 0 0 0 0 1 0 0 0 0 0 0 1
이상값임계값계산하기
이상값이들어있는데이터의벡터를만듭니다。이상값방법으로결정된임계값과중심값,이상값의위치를찾아서플로팅합니다。중심값은데이터의중앙값이며,상한/하한임계값은중앙값으로부터스케일링된3疯狂만큼위그리고아래에있는값입니다。
X = 1:10;A = [60 59 49 49 58 100 61 57 48 58];[TF,L,U,C] = isoutlier(A);情节(x, x (TF), (TF),“x”x L * (10), x, U * (10), x, C *的(10))传说(“原始数据”,“离群值”,“低门槛”,“上阈值”,的中心值)
입력marketing수
一个
- - - - - -입력데이터
벡터|행렬|다차원배열|테이블|타임테이블
입력데이터로,벡터,행렬,다차원배열,表형또는时间表형으로지정됩니다。
一个
가表형表경우그변수는双
형 또는单
형이어야하며,아니면“DataVariables”
이름-값쌍을사용하여双
형 또는单
형변수를명시적으로나열할수있습니다。双
또는单
이아닌데이터형의변수가들어있는테이블을사용하는경우변수를지정하는것이유용합니다。
一个
가时间表형경우isoutlier
는테이블소에대해서만동작합니다。행시간값은고유해야하며오름차순으로나열되어야합니다。
데이터형:双
|单
|表格
|时间表
方法
- - - - - -이상값감지방법
“中值”
(디폴트값)|“的意思是”
|四分位数的
|“拉布”
|“gesd”
이상값감지방법으로,다음중하나로지정됩니다。
방법 | 설명 |
---|---|
“中值” |
중앙값에서스케일링된3 mad를초과하여떨어져있는소에대해真正的 를반환합니다。스케일링된mad는c *值(abs(中位数(A))) 로정의됩니다。여기서c = 1 /(√(2)* erfcinv (3/2)) 입니다。 |
“的意思是” |
평균에서3준편차를초과하여떨어져있는소에대해真正的 를반환합니다。이 방법은“中值” 보다빠르지만덜견고합니다。 |
四分位数的 |
상위사분위수와하위사분위수에서각각1.5사분위범위를초과해크거나작은요소에대해真正的 를반환합니다。이 방법은一个 의데이터가정규분포되지않은경우에유용합니다。 |
“拉布” |
가설검정을기반으로이상값1개를매회제거하는그럽스검정(Grubbs测试)을적용합니다。이방법에서는一个 의데이터가정규분포된것으로가정합니다。 |
“gesd” |
이상값에대해일반화된극단적스튜던트화이탈(极端Studentized偏离)검정을적용합니다。이반복법은“拉布” 와유사하지만,서로를감추는여러이상값이있는경우더효율적일수있습니다。 |
阈值
- - - - - -백분위수임계값
소를2개가진행벡터
백분위수임계값으로,요소가구간[0100]에있는요소를2개가진행벡터로지정됩니다。첫번째요소는백분위수하한임계값을나타내고두번째요소는백분위수상한임계값을나타냅니다。예를들어,임계값[90]
은이상값을10번째백분위수아래에있는점과90번째백분위수위에있는점으로정의합니다。阈值
의첫번째소는두번째소보다작아야합니다。
movmethod
- - - - - -이동 방법
“movmedian”
|“movmean”
이상값감지에사용하는이동방법으로,다음중하나로지정됩니다。
방법 | 설명 |
---|---|
“movmedian” |
窗口 로지정된윈도우길이에걸쳐국소중앙값에서국소스케일링된3疯狂를초과하여떨어져있는요소에대해真正的 를반환합니다。이 방법은햄펄 필터라고도합니다。 |
“movmean” |
窗口 로지정된윈도우길이에걸쳐국소평균에서3국소표준편차를초과하여떨어져있는요소에대해真正的 를반환합니다。 |
窗口
- - - - - -윈도우길이
양의정수스칼라|양의정수로구성된소를2개가진벡터|양의duration형스칼라|양의duration형으로구성된소를2개가진벡터
윈도우길이로,양의정수스칼라,양의정수로구성된요소를2개가진벡터,양형의持续时间스칼라또는양형의持续时间으로구성된요소를2개가진벡터로지정됩니다。
窗口
가양의정수스칼라경우윈도우는현재소의근지점에중심을두며,窗口1
개의접소를가집니다。窗口
가짝수이면윈도우의중심은현재소및이전소가됩니다。
窗口
가양의정수로구성된소를2개가진벡터f [b]
경우윈도우에는현재소,현재소의역방향으로b
개소,그리고현재소의정방향으로f
개소가들어있습니다。
一个
가时间表형이거나“SamplePoints”
가datetime
형 또는持续时间
형벡터로지정된경우窗口
는持续时间
형이어야하며,윈도우는샘플점을기준으로하여계산됩니다。
데이터형:双
|单
|int8
|int16
|int32
|int64
|uint8
|uint16
|uint32
|uint64
|持续时间
昏暗的
- - - - - -연산을수행할차원
양의정수스칼라
연산을수행할차원으로,양의정수스칼라로지정됩니다。값이지정되지않은경우디폴트값은크기가1이아닌첫번째배열차원이됩니다。
행렬一个
가있다고가정합니다。
isoutlier (1)
은一个
의각열에있는데이터에따라이상값을감지합니다。
isoutlier (2)
는一个
의각행에있는데이터에따라이상값을감지합니다。
一个
가테이블또는타임테이블이면昏暗的
이지원되지않습니다。isoutlier
는각테이블변수나타임테이블변수를따라동작합니다。
데이터형:双
|单
|int8
|int16
|int32
|int64
|uint8
|uint16
|uint32
|uint64
이름-값通讯录수
예:isoutlier (A,‘意思’,‘ThresholdFactor’,4)
선택적으로名称,值
수가쉼로구분되어지정됩니다。여기서的名字
은수이름이고价值
는대응값입니다。的名字
은따옴。Name1, Value1,…,的家
과같이여러개의이름-값쌍의通讯录수를어떤순서로든지정할수있습니다。
SamplePoints
- - - - - -샘플 점
벡터|테이블변수이름|스칼라|함수 핸들|테이블vartype
첨자
샘플점으로,“SamplePoints”
와함께샘플점값으로구성된벡터가쉼표로구분되어지정되거나,또는입력데이터가테이블인경우다음표의옵션과함께구성된쌍이쉼표로구분되어지정됩니다。샘플점은데이터의x축위치를나타내며,이샘플점은정렬되고고유한요소를가져야합니다。샘플점은균일하게샘플링할필가없습니다。벡터[1 2 3…]
이디폴트값입니다。
이입력데이터가테이블이면다음옵션중하나를사용하여샘플점을테이블변수로지정할수있습니다。
테이블입력값에대한옵션 | 설명 | 예제 |
---|---|---|
변수 이름 | 단일테이블변수이름을지정하는문자형벡터또는字符串형스칼라 |
|
스칼라변수덱스 | 스칼라테이블변수덱스 |
|
논리형벡터 | 각각의소가테이블변수에해당하는논리형벡터로,여기서 |
|
함수 핸들 | 테이블변수를입력값으로받고논리형스칼라를반환하는함수핸들,로하나의테이블변수에대해서만 |
|
vartype 첨자 |
|
|
참고
입력데이터가时间表
형경우에는이이름—값쌍이지원되지않습니다。타임테이블은항상행시간값으로구성된벡터를샘플점으로사용합니다。다른샘플점을사용하려면행시간값이원하는샘플점을포함하도록타임테이블을편집해야합니다。
이동윈도우는샘플점을기준으로정의됩니다。예를들어,t
가입력데이터에해당하는시간벡터경우isoutlier(兰德(1 10)“movmean”,3,SamplePoints, t)
는-1.5 t(我)
~t(我)+ 1.5
범위의시간구간을나타내는윈도우를가집니다。
샘플점벡터의데이터형이datetime
형 또는持续时间
형경우이동윈도우길이는持续时间
형이어야합니다。
예:isoutlier (A ' SamplePoints 0:0.1:10)
예:isoutlier (T,“SamplePoints”,“Var1”)
데이터형:单
|双
|datetime
|持续时间
DataVariables
- - - - - -연산을수행할테이블변수
테이블변수이름|스칼라|벡터|셀형 배열|함수 핸들|테이블vartype
첨자
연산을수행할테이블변수로,“DataVariables”
와함께다음` ` `에있는옵션중하나가쉼` ` ` `로구분되어지정됩니다。“DataVariables”
값은입력테이블에서이상값이있는지조사할변수를나타냅니다。지정된변수와연결된데이터형은双
또는单
이어야합니다。테이블에서“DataVariables”
로지정되지않은다른변수는연산이수행되지않으므로출력값은이러한변수에대해假
값을포함합니다。
옵션 | 설명 | 예제 |
---|---|---|
변수 이름 | 단일테이블변수이름을지정하는문자형벡터또는字符串형스칼라 |
|
변수이름으로구성된벡터 | 각소가테이블변수이름,문자형벡터또는string형배열로구성된셀형배열 |
|
스칼라또는변수덱스로구성된벡터 | 스칼라또는테이블변수덱스로구성된벡터 |
|
논리형벡터 | 각각의소가테이블변수에해당하는논리형벡터。여기서 |
|
함수 핸들 | 테이블변수를입력값으로받고논리형스칼라를반환하는함수핸들 |
|
vartype 첨자 |
|
|
예:isoutlier(T,'DataVariables',["Var1" "Var2" "Var4"])
ThresholdFactor
- - - - - -감지임계값자
음이아닌스칼라
감지임계값marketing자로,“ThresholdFactor”
와함께음이아닌스칼라가쉼@ @로구분되어지정됩니다。
“中值”
과“movmedian”
방법의경우감지임계값자가스케일링된mad의개수를대체합니다。디폴트값은3입니다。
“的意思是”
과“movmean”
방법의경우감지임계값자가평균에서벗어난준편차의개수를대체합니다。디폴트값은3입니다。
“拉布”
와“gesd”
방법의경우감지임계값자는0 ~ 1범위의스칼라입니다。값이0에가까우면이상값수가적어지고,값이1에가까우면이상값수가많아집니다。디폴트감지임계값marketing자는0.05입니다。
四分位数的
방법의경우감지임계값자가사분위범위의개수를대체합니다。디폴트값은1.5입니다。
이이름-값쌍은지정된방법이百分位数的
경우에는지원되지않습니다。
데이터형:双
|单
|int8
|int16
|int32
|int64
|uint8
|uint16
|uint32
|uint64
MaxNumOutliers
- - - - - -최대이상값개수
양의 정수
최대이상값개수로(“gesd”
방법만해당),“MaxNumOutliers”
와함께양의정수가쉼@ @로구분되어지정됩니다。“MaxNumOutliers”
값은“gesd”
방법이반환하는최대이상값수를지정합니다。예를들어,isoutlier (A,‘gesd’,‘MaxNumOutliers’,5)
는5개이하의이상값을반환합니다。
“MaxNumOutliers”
의디폴트값은一个
에있는소개수의10%에가장가까운정수입니다。최대이상값수를큰수로설정하면모든이상값이감지되도록할수있지만,계산효율성은떨어집니다。
“gesd”
방법은이상값이아닌입력데이터가근사정규분포에서추출된것으로가정합니다。데이터가이러한방식으로추출되지않은경우반환되는이상값의개수는“MaxNumOutliers”
값을초과할수있습니다。
데이터형:双
|单
|int8
|int16
|int32
|int64
|uint8
|uint16
|uint32
|uint64
출력marketing수
特遣部队
-이상값시자
벡터|행렬|다차원배열
이상값` ` ` ` `시자로,벡터,행렬또는다차원배열로반환됩니다。特遣部队
의소는一个
의대응소가이상값이면真正的
이고,그렇지않으면假
입니다。特遣部队
의 크기는一个
와같습니다。
데이터형:逻辑
l
-하한임계값
스칼라|벡터|행렬|다차원배열|테이블|타임테이블
이상값감지방법이사용하는하한임계값으로,스칼라,벡터,행렬,다차원배열,테이블또는타임테이블로반환됩니다。예를들어디,폴트이상값감지방법의하한값은입력데이터중앙값에서스케일링된3疯狂아래값입니다。길이가1 rm연산차원을제외한모든차원에서l
의 크기는一个
와같습니다。
데이터형:双
|单
|表格
|时间表
U
-상한임계값
스칼라|벡터|행렬|다차원배열|테이블|타임테이블
이상값감지방법이사용하는상한임계값으로,스칼라,벡터,행렬,다차원배열,테이블또는타임테이블로반환됩니다。예를들어디,폴트이상값감지방법의상한값은입력데이터중앙값에서스케일링된3疯狂위값입니다。길이가1 rm연산차원을제외한모든차원에서U
의 크기는一个
와같습니다。
데이터형:双
|单
|表格
|时间表
C
-중심값
스칼라|벡터|행렬|다차원배열|테이블|타임테이블
이상값감지방법이사용하는중심값으로,스칼라,벡터,행렬,다차원배열,테이블또는타임테이블로반환됩니다。예를들어,디폴트이상값감지방법의중심값은입력데이터의중앙값입니다。길이가1 rm연산차원을제외한모든차원에서C
의 크기는一个
와같습니다。
데이터형:双
|单
|表格
|时间表
세부 정보
중앙값절대편차
N개의스칼라관측값으로구성된확률변수벡터一에대해,중앙값절대편차(疯狂)는다음과같이정의됩니다。
여기서i = 1,2,…,N입니다。
스케일링된mad는c *值(abs(中位数(A)))
로정의됩니다。여기서c = 1 /(√(2)* erfcinv (3/2))
입니다。
확장 기능
高형배열
메모리에담을수없을정도로많은행을가진배열을계산할수있습니다。
사용법관련참고및제한사항:
百分位数的
,“拉布”
,“gesd”
방법은지원되지않습니다。“movmedian”
방법과“movmean”
방법은高형타임테이블을지원하지않습니다。“SamplePoints”
및“MaxNumOutliers”
이름-값쌍은지원되지않습니다。“DataVariables”
의값은함수핸들일수없습니다。一个
가tall형열벡터경우에만첫번째차원에대해isoutlier (A)
,isoutlier(“中位数”,…)
또는isoutlier(四分位数的,…)
를계산할수있습니다。
자세한내용은高형배열항목을참조하십시오。
C/ c++코드생성
MATLAB®Coder™를사용하여C코드나c++코드를생성할수있습니다。
사용법관련참고및제한사항:
이상값감지를위한
“movmean”
방법과“movmedian”
방법은时间表형입력데이터,日期时间형“SamplePoints”
값또는duration형“SamplePoints”
값을지원하지않습니다。字符串형과문자형배열입력값은상수여야합니다。
스레드기반환경
MATLAB®의backgroundPool
을사용해백그라운드에서코드를실행하거나并行计算工具箱™의ThreadPool
을사용해코드실행속도를높일수있습니다。
이함수는스레드기반환경을완전히지원합니다。자세한내용은在线程环境中运行MATLAB函数항목을참조하십시오。
Gpu배열
并行计算工具箱™를사용해GPU(그래픽스처리장치)에서실행하여코드실행속도를높일수있습니다。
사용법관련참고및제한사항:
“movmedian”
이동방법은지원되지않습니다。“SamplePoints”
및“DataVariables”
이름-값쌍은지원되지않습니다。
자세한내용은Gpu에서matlab함수실행하기(并行计算工具箱)항목을참조하십시오。
버전 내역
Matlab명령
다음matlab명령에해당하는링크를클릭했습니다。
명령을실행하려면matlab명령창에입력하십시오。웹브라우저는matlab명령을지원하지않습니다。
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。