主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

高配列の可視化

大規模なデータセットを可視化するには,画面上にプロットする点の数を減らすために何らかの方法でデータを集約,ビニング,またはサンプリングする必要があります。直方图などの一部の関数は,データをビン化してサイズを削減します。また,情节散射などの他の関数は,より複雑なアプローチを使用して,重複するピクセルを画面上にプロットしないようにします。ピクセルのオーバーラップが解析に関連している問題では,関数binscatterは密度パターンを効果的に可視化する方法も提供します。

高配列を可視化する際に收集を使用する“必要はありません”。高配列の可視化は MATLAB®によって即座に評価されて表示されます。現在,以下の表の関数およびメソッドを使用して高配列を可視化できます。

関数 必要なツールボックス メモ
情节 - - - - - -

これらの関数は反復してプロットし,読み取ったデータの増加に伴い順次プロットに追加します。更新中は,進行状況インジケーターにプロット済みデータの比率が表示されます。更新プロセス中は,プロットが完了するまでズームと移動がサポートされます。更新プロセスを停止するには,進行状況インジケーターの[一時停止]ボタンを押します。

散射 - - - - - -
binscatter - - - - - -
直方图 - - - - - -
histogram2 - - - - - -
- - - - - -

カテゴリカルデータの可視化のみ。

binscatterplot.(统计与机器学习工具箱) 统计和机器学习工具箱™

图に明显さ色スライダーははははははははははははははははは。伽玛イメージ補正パラメーターの値を調整します。

ksdity(统计与机器学习工具箱) 统计和机器学习工具箱

100年一変量データでは個の点,二変量データでは900個の点で評価された,データの確率密度推定値を生成します。

datasample(统计与机器学习工具箱) 统计和机器学习工具箱

datasampleにより,単純なインデックス付けと比較して,統計的に安定した方法で高配列のサブサンプルを抽出できます。データのサブセットがメモリに収まる程度に小さい場合は,直接高配列をサポートしないプロット関数および近似関数をサブセットに対して使用できます。

高配列のプロットの例

この例では,高配列を可視化する方法をいくつか示します。

航空会社のフライトデータの行を含むAirlinesmall.csv.データセット用のデータストアを作成します。処理する表変数のサブセットを選択して,欠損値のある列を削除します。

ds = tabularTextDatastore (“airlinesmall.csv”“TreatAsMissing”“NA”);ds.selectedvariablenames = {“年”“月”“ArrDelay”“DepDelay”“起源”'dest'};T =高(ds);T = rmmissing (T)
T = Mx6高表年月ArrDelay DepDelay起源服务台  ____ _____ ________ ________ _______ _______ 1987年10 8 12{“宽松”}{‘SJC} 1987年10 8 1{‘SJC}{“钻”}1987年10 21 20{‘圣’}{SMF的}1987年10 13 12{“钻”}{‘SJC} 1987年10 4 1 {SMF的}{“宽松”}59 1987 63{“宽松”}{‘SJC} 1987年10 3 2{‘圣’}{“旧金山”}1987年10 11 1{‘海’}{松懈 '} : : : : :: : : : : : :

月別のフライトを示す円グラフ

数量型の数を,月の名前を反映した直言変数に変換します。次に,その年の各月のデータに含まれているフライト数を示す円グラフをプロットします。

T.Month =分类(T。月,1:12,{'1月'2月的“3”4月的“可能”“君”“7”“8月”“9”“10月”11月的12月的})
T = MX6高表年份Arrdelay Depdelay Origin __________________________________________ 1987 10月12日'san'} {'smf'} 1987年10月13日{'bur'} 1987年10月4日-1 {'smf'} {'lax'} 1987年10月59 63 {'lax'} {'sjc'} 1987年10月3日-2 {'SAN'} {'SFO'} 1987年10月11日-1 {'SEA'} {'LAX'} :::::::::::::::::::::::::
派(T.Month)
使用本地MATLAB会话评估高表达式:-通过1 / 2:在1.4秒完成-通过2 / 2:在1.1秒完成评估在3.2秒完成

遅延のヒストグラム

データ内の各フライトの到着遅延時間のヒストグラムをプロットします。データには長い裾があるため,名前と値のペアBinLimitsを使用してプロット領域を制限します。

直方图(T。ArrDelay,'binlimits'150年[-50])
使用本地MATLAB会话评估高表达: - 通过第1条:第2条:在2.7秒内完成 - 通过2的2:在1.2秒评估中完成,在4.7秒内完成

图中包含一个轴。轴包含一个直方图类型的对象。

遅延の散布図

到着と出発の遅延時間の散布図をプロットします。出発が遅れたフライトは到着も遅れる可能性が高いため,これらの変数の間には強い相関関係が予想されます。

高配列を扱う場合,関数情节散射,およびbinscatterは反復してデータをプロットし,追加のデータを読み取るたびに順次プロットに追加します。更新中は,プロットされたデータ量を示す進行状況インジケーターがプロットの上部に表示されます。更新中は,プロットが完了するまでズームと移動がサポートされます。

散射(T.Arrdelay,T.Depdelay)Xlabel(“延误”)ylabel(离职的延迟)XLIM([ -  140 1000])ylim([ -  140 1000])

图中包含一个轴。轴包含类型散射的对象。

進行状況バーには[一时/再开]ボタンも含まれます。十分なデータが表示された時点で,ボタンを使用してプロットの更新を早めに停止します。

トレンドラインの近似

関数polyfitおよび多尔を使用して,到着遅延時間と出発遅延時間のプロット上に線形トレンドラインを重ね合わせて表示します。

持有p = polyfit(t.arrdelay,t.depdelay,1);x =排序(t.Arrdelay,1);yp = polyval(p,x);绘图(x,yp,的r -) 抓住

图中包含一个轴。轴包含2个散射,线的物体。

密度の可視化

点の散布図はある程度役に立ちますが,点が過度にオーバーラップしているとプロットからの情報の解読が困難になる場合があります。その場合は,プロットの点の密度を可視化してトレンドを検出すると便利です。

関数binscatterを使用して,到着遅延時間と出発遅延時間のプロットの点の密度を可視化します。

binscatter (T.ArrDelay T.DepDelay,“XLimits”(-100 1000),“YLimits”xlabel([-100 1000]) xlabel([-100 1000]) xlabel([-100 1000])“延误”)ylabel(离职的延迟

图中包含一个轴。坐标轴包含binscatter类型的对象。

座標軸の这一。

AX = GCA;ax.clim = [0 150];

图中包含一个轴。坐标轴包含binscatter类型的对象。

参考

||

関連するトピック