主要内容

このペ,ジの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

高大配列のヒストグラム

この例では,柱状图およびhistogram2を使用して,高配列に含まれるデ,タを解析および可視化する方法を説明します。

高テ,ブルの作成

airlinesmall.csvデ,タセットを使用してデ,タストアを作成します。“NA”値を欠損デ,タとして処理し,値と置き換えます。使用する変数のサブセットを選択します。デタストアを高テブルに変換します。

Varnames = {“ArrDelay”“DepDelay”“年”“月”};ds = tabularTextDatastore(“airlinesmall.csv”“TreatAsMissing”“NA”“SelectedVariableNames”, varnames);T =高(ds)
T = Mx4高表ArrDelay DepDelay年月________ ________ ____ _____ 8 12 1987 10 8 1 1987 10 21 20 1987 10 13 12 1987 10 4 -1 1987 10 59 63 1987 10 3 -2 1987 10 11 -1 1987 10::::::::

到着遅延時間のヒストグラムのプロット

到着遅延時間の頻度の分布を調べるために,変数ArrDelayのヒストグラムをプロットします。

h =直方图(T.ArrDelay);
使用本地MATLAB会话评估tall表达式:-通过2中的1:在1秒内完成-通过2中的2:在0.53秒内完成评估在2.7秒内完成
标题(“1987 - 2008年航班延误”)包含(“到达延误(分钟)”) ylabel (“频率”

图中包含一个轴对象。标题为“航班到达延误,1987 - 2008”的axes对象包含类型为直方图的对象。

到着遅延時間は0に近い小さな数値の頻度が最も高く,それらの値がプロットの大半を占めるため,その他の詳細部分が確認しにくくなっています。

ヒストグラムのビンの範囲の調整

-50 ~ 150分の間の到着遅延時間のみをプロットするようにヒストグラムのビンの範囲を制限します。高配列から直方图オブジェクトを作成した後は,BinWidthBinLimitsなど,ビンの再計算が必要となるプロパティは変更できません。また,morebinsfewerbinsを使用してビン数を調整することもできません。このような場合には,柱状图を使用して高配列の生デ,タからヒストグラムを再作成します。

图直方图(T。ArrDelay,“BinLimits”[-50150])
使用本地MATLAB会话评估tall表达式:-通过2中的第1步:在1秒内完成-通过2中的第2步:在0.59秒内完成评估在2.4秒内完成
标题(1987年至2008年,航班到达延误时间在-50分钟至150分钟之间)包含(“到达延误(分钟)”) ylabel (“频率”

图中包含一个轴对象。标题为“航班到达延迟在-50到150分钟之间,1987 - 2008”的axes对象包含一个类型为直方图的对象。

このプロットでは,長時間の遅延の頻度が当初の予想よりも高い可能性があります。さらに詳しく調べるために,1時間以上の到着遅延時間の確率を求めます。

1時間以上の遅延の確率

元のヒストグラムが返したhオブジェクトでは,プロパティにビンの値が,BinEdgesプロパティにビンのエッジが含まれています。これらのプロパティを使用することで,电子邮件ンメモリ計算を実行できます。

どのビンに1時間(60分)以上の到着遅延時間が含まれているかを見けます。論理esc escンデックスベクトルから最後のビンのエッジを削除して,ビン値のベクトルと同じ長さにします。

idx = h.BinEdges >= 60;Idx (end) = [];

選択した各ビンに関連付けられている値を取得するには,idxを使用します。ビンの値を合計して総サンプル数で除算し,100を乗算して,1時間以上の遅延全体の確率を求めます。サンプルの合計数は元のデ,タセットから計算しているため,收集を使用して計算を明示的に評価し,。

N =数字(T.ArrDelay);P = sum(h.Values(idx))*100/N)
P = 4.4809

全体的にみて,1時間以上の到着遅延時間の確率は約4.5%です。

遅延の月別二変量ヒストグラムのプロット

60分以上の到着遅延時間にいて,月別の二変量ヒストグラムをプロットします。このプロットによって,季節性が到着遅延時間に与える影響を調べます。

图h2 = histogram2(T. month,T.;ArrDelay, 50 [12],“YBinLimits”(1100),“归一化”“概率”“FaceColor”“平”);
使用本地MATLAB会话计算tall表达式:-通过1 / 1:在1.2秒内完成,在1.5秒内完成,使用本地MATLAB会话计算tall表达式:-通过1 / 1:在0.96秒内完成,在1.1秒内完成
标题(“延误1小时或以上的概率(按月计算)”)包含(“月(1 - 12)”) ylabel (“到达延误(分钟)”) zlabel (“概率”) xticks(1:12) view(-126,23)

图中包含一个轴对象。标题为“到达延迟1小时或更大概率(按月)”的axes对象包含一个类型为histogram2的对象。

月別の遅延統計

二変量ヒストグラムオブジェクトを使用して,月ごとの1時間以上の到着遅延時間の確率と,各月の平均到着遅延時間を計算します。確率情報を含む変数Pと平均到着遅延時間を含む変数MeanByMonthをも表に結果を格納します。

monthNames = {“1月”2月的“3”4月的“可能”“君”“7”“8月”“9”“10月”11月的12月的} ';G = findgroups(T.Month);M = splitapply(@(x) mean(x,“omitnan”)、T.ArrDelay G);delayByMonth = table(monthNames, sum(h2.Values,2)*100, gather(M),“VariableNames”, {“月”“P”“MeanByMonth”})
使用本地MATLAB会话评估tall表达式:-通过2中的第1步:在0.46秒内完成-通过2中的第2步:在1.4秒内完成评估,在2.6秒内完成
delayByMonth =12×3表月P MeanByMonth  _______ ______ ___________ {' } 1月9.6497 - 8.5954 7.7058 - 7.3275{' 2月'}{“Mar”}9.0543 - 7.5536{4月的}7.2504 - 6.0081 7.4256 - 5.2949{‘可能’}{“君”}10.35 - 10.264{‘7’}10.228 - 8.7797 8.5989 - 7.4522{“8月”}{‘9’}5.4116 - 3.6308{10月的}6.042 - 4.6059{11月的}6.9002 5.2835{12月的}11.384 - 10.571

結果は,休暇月の12月の便が1時間以上遅れる可能性でが11.4%,平均遅延時間は10.5分であることを示しています。これにわずかな差で夏季の6月と7月が続き,これらの1時間以上の遅延の確率はで約10%,平均遅延時間はおおよそ9から10分です。

参考

||

関連するトピック