このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。
高配列の可視化
大規模なデータセットを可視化するには,画面上にプロットする点の数を減らすために何らかの方法でデータを集約,ビニング,またはサンプリングする必要があります。直方图
や派
などの一部の関数は,データをビン化してサイズを削減します。また,情节
や散射
などの他の関数は,より複雑なアプローチを使用して,重複するピクセルを画面上にプロットしないようにします。ピクセルのオーバーラップが解析に関連している問題では,関数binscatter
は密度パターンを効果的に可視化する方法も提供します。
高配列を可視化する際に收集
を使用する“必要はありません”。高配列の可視化は MATLAB®によって即座に評価されて表示されます。現在,以下の表の関数およびメソッドを使用して高配列を可視化できます。
関数 | 必要なツールボックス | メモ |
---|---|---|
情节 |
- - - - - - | これらの関数は反復してプロットし,読み取ったデータの増加に伴い順次プロットに追加します。更新中は,進行状況インジケーターにプロット済みデータの比率が表示されます。更新プロセス中は,プロットが完了するまでズームと移動がサポートされます。更新プロセスを停止するには,進行状況インジケーターの[一時停止]ボタンを押します。 |
散射 |
- - - - - - | |
binscatter |
- - - - - - | |
直方图 |
- - - - - - | |
histogram2 |
- - - - - - | |
派 |
- - - - - - | カテゴリカルデータの可視化のみ。 |
binscatterplot. (统计与机器学习工具箱) |
统计和机器学习工具箱™ | 图に明显さ色スライダーははははははははははははははははは。 |
ksdity (统计与机器学习工具箱) |
统计和机器学习工具箱 | 100年一変量データでは個の点,二変量データでは900個の点で評価された,データの確率密度推定値を生成します。 |
datasample (统计与机器学习工具箱) |
统计和机器学习工具箱 |
|
高配列のプロットの例
この例では,高配列を可視化する方法をいくつか示します。
航空会社のフライトデータの行を含むAirlinesmall.csv.
データセット用のデータストアを作成します。処理する表変数のサブセットを選択して,欠損値のある列を削除します。
ds = tabularTextDatastore (“airlinesmall.csv”,“TreatAsMissing”,“NA”);ds.selectedvariablenames = {“年”,“月”,“ArrDelay”,“DepDelay”,“起源”,'dest'};T =高(ds);T = rmmissing (T)
T = Mx6高表年月ArrDelay DepDelay起源服务台 ____ _____ ________ ________ _______ _______ 1987年10 8 12{“宽松”}{‘SJC} 1987年10 8 1{‘SJC}{“钻”}1987年10 21 20{‘圣’}{SMF的}1987年10 13 12{“钻”}{‘SJC} 1987年10 4 1 {SMF的}{“宽松”}59 1987 63{“宽松”}{‘SJC} 1987年10 3 2{‘圣’}{“旧金山”}1987年10 11 1{‘海’}{松懈 '} : : : : :: : : : : : :
月別のフライトを示す円グラフ
数量型の数月
を,月の名前を反映した直言変数に変換します。次に,その年の各月のデータに含まれているフライト数を示す円グラフをプロットします。
T.Month =分类(T。月,1:12,{'1月',2月的,“3”,4月的,“可能”,“君”,“7”,“8月”,“9”,“10月”,11月的,12月的})
T = MX6高表年份Arrdelay Depdelay Origin __________________________________________ 1987 10月12日'san'} {'smf'} 1987年10月13日{'bur'} 1987年10月4日-1 {'smf'} {'lax'} 1987年10月59 63 {'lax'} {'sjc'} 1987年10月3日-2 {'SAN'} {'SFO'} 1987年10月11日-1 {'SEA'} {'LAX'} :::::::::::::::::::::::::
派(T.Month)
使用本地MATLAB会话评估高表达式:-通过1 / 2:在1.4秒完成-通过2 / 2:在1.1秒完成评估在3.2秒完成
遅延のヒストグラム
データ内の各フライトの到着遅延時間のヒストグラムをプロットします。データには長い裾があるため,名前と値のペアBinLimits
を使用してプロット領域を制限します。
直方图(T。ArrDelay,'binlimits'150年[-50])
使用本地MATLAB会话评估高表达: - 通过第1条:第2条:在2.7秒内完成 - 通过2的2:在1.2秒评估中完成,在4.7秒内完成
遅延の散布図
到着と出発の遅延時間の散布図をプロットします。出発が遅れたフライトは到着も遅れる可能性が高いため,これらの変数の間には強い相関関係が予想されます。
高配列を扱う場合,関数情节
、散射
,およびbinscatter
は反復してデータをプロットし,追加のデータを読み取るたびに順次プロットに追加します。更新中は,プロットされたデータ量を示す進行状況インジケーターがプロットの上部に表示されます。更新中は,プロットが完了するまでズームと移動がサポートされます。
散射(T.Arrdelay,T.Depdelay)Xlabel(“延误”)ylabel(离职的延迟)XLIM([ - 140 1000])ylim([ - 140 1000])
進行状況バーには[一时/再开]ボタンも含まれます。十分なデータが表示された時点で,ボタンを使用してプロットの更新を早めに停止します。
トレンドラインの近似
関数polyfit
および多尔
を使用して,到着遅延時間と出発遅延時間のプロット上に線形トレンドラインを重ね合わせて表示します。
持有在p = polyfit(t.arrdelay,t.depdelay,1);x =排序(t.Arrdelay,1);yp = polyval(p,x);绘图(x,yp,的r -) 抓住从
密度の可視化
点の散布図はある程度役に立ちますが,点が過度にオーバーラップしているとプロットからの情報の解読が困難になる場合があります。その場合は,プロットの点の密度を可視化してトレンドを検出すると便利です。
関数binscatter
を使用して,到着遅延時間と出発遅延時間のプロットの点の密度を可視化します。
binscatter (T.ArrDelay T.DepDelay,“XLimits”(-100 1000),“YLimits”xlabel([-100 1000]) xlabel([-100 1000]) xlabel([-100 1000])“延误”)ylabel(离职的延迟)
座標軸の这一
。
AX = GCA;ax.clim = [0 150];