主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

excludedata

近似からデータを排除

説明

特遣部队= excludedata (xy“盒子”,盒子は,どの要素が盒子によって指定されたXY平面のボックスの外側にあるかを示す逻辑配列を返します。特遣部队の要素は,ボックスの外側のデータ点については1,ボックスの内側のデータ点については0となります。适合を使用して曲線を当てはめる際にデータを排除するには,“排除”値として特遣部队を指定します。

特遣部队= excludedata (xy“域”,は,の区間外のx値をもつデータ点を特定します。

特遣部队= excludedata (xy“范围”,范围は,范围の区間外のy値をもつデータ点を特定します。

特遣部队= excludedata (xy“指标”,指数は,インデックスが指数と等しいデータ点を特定します。

すべて折りたたむ

ランダムデータを使用して排除規則を可視化します。

ランダムなxおよびyデータを生成します。

Xdata = -3 + 6*rand(1,1e4);Ydata = -3 + 6*rand(1,1e4);

例として,ボックス[-1 1 -1]の内側またはドメイン(2 - 2)の外側のいずれかのデータを排除します。

outliers1 = ~ excludedata (xdata ydata,“盒子”,[-1 1 -1]);outliers2 = excludedata (xdata ydata,“域”(2 - 2));离群值= outliers1 | outliers2;

排除されていないデータをプロットします。白の領域は排除された領域に対応します。

情节(xdata异常值(~)、ydata(~离群值),“。”)轴([-3 3 -3])轴广场

图中包含一个坐标轴。轴包含一个线型对象。

2000年アメリカ合衆国大統領選挙におけるフロリダ州の投票数と郡名を読み込みます

负载flvote2k

2大政党の候補者であるブッシュとゴアへの投票数を,サードパーティの候補者であるブキャナンへの投票数の予測子として使用し,散布図をプロットします。

情节(布什,布坎南,“rs”)举行情节(戈尔,布坎南“波”)传说(“布什数据”“戈尔数据”

图中包含一个坐标轴。轴线包含2个线型对象。这些对象代表了布什和戈尔的数据。

ブッシュまたはゴアへの固定割合の投票者がブキャナンに投票するモデルを仮定します。

f = fittype ({“x”})
线性模型:f(a,x) = a*x

問題視されていた”チョウ型”投票用紙を使用しなかった不在投票者のデータは除外します。

nobutterfly = strcmp(县、“缺席选票”);

モデルの二重平方重みのロバスト近似を2つのデータセットに対して実行し,不在投票者を排除します。

bushfit =适合(布什,布坎南,f,“排除”nobutterfly,“稳健”“上”);gorefit =适合(戈尔,布坎南,f,“排除”nobutterfly,“稳健”“上”);

ロバスト近似により外れ値に小さい重みが与えられるため,ロバスト近似の大きな残差を使用して外れ値を特定できます。

图绘制(bushfit,布什,布坎南,“rs”“残差”)举行情节(gorefit戈尔,布坎南“波”“残差”

图中包含一个坐标轴。轴包含4个线型对象。这些对象表示数据,零线。

残差を計算します。

Bushres = buchanan - feval(bushfit,bush);戈尔雷斯=布坎南-费瓦尔(戈菲特,戈尔);

範囲(-500 500)の外側にあるものを大きな残差と見なします。

bushoutliers = excludedata (bushres,布什“范围”500年[-500]);goreoutliers = excludedata(戈尔,格勒“范围”500年[-500]);

外れ値に対応する郡を表示します。マイアミデイド郡とブロワード郡は予測子の最大値に対応します。州で唯一“チョウ型”投票用紙を使用したパームビーチ郡は,最大残差値に対応します。

县(bushoutliers)
ans =2 x1细胞{“迈阿密戴德”}{棕榈滩的}
县(goreoutliers)
ans =3 x1细胞{'布劳沃德'}{'迈阿密-戴德'}{'棕榈滩'}

入力引数

すべて折りたたむ

データ値のデータサイト。数値ベクトルとして指定します。

データ値。数値ベクトルとして指定します。

範囲外のデータを検出するためのボックス。4要素の数値ベクトル[xmin xmax ymin ymax]として指定します。

例:[-1 1 0 2]

範囲外のデータを検出するための領域。2要素の数値ベクトル[xmin xmax]として指定します。

例:[1]

範囲外のデータを検出するための範囲。2要素の数値ベクトル[ymin ymax]として指定します。

例:[3 - 4]

検出するデータ点のインデックス。数値ベクトルとして指定します。

例:(3 7 9)

R2006aより前に導入