このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。
確率分布は,本来の母集団に関する仮定に基づく理論上の分布です。確率分布は,確率変数が特定の離散値をもつ事象、あるいは指定の連続値の範囲に収まる事象に対して確率を与えます。
统计和机器学习工具箱™には,確率分布を処理する方法がいくつか用意されています。
確率分布オブジェクトを使用すると,確率分布オブジェクトで標本データを近似することや,パラメーター値を指定して確率分布オブジェクトを作成することができます。
確率分布関数を使用すると,行列からのデータ入力を処理できます。
確率分布アプリおよびユーザーインターフェイスを使用すると,確率分布の乱数を対話的に近似,調査および生成できます。次のアプリとユーザーインターフェイスを使用できます。
统计和机器学习工具箱でサポートされている分布の一覧については,サポートされている分布を参照してください。
カスタム分布の確率オブジェクトを定義してから,分布钳工アプリまたは確率オブジェクト関数(pdf
、提供
、icdf
、随机
など)を使用して,分布の評価や乱数の生成などを行うことができます。詳細については,分布钳工アプリの使用によるカスタム分布の定義を参照してください。また,関数ハンドルを使用してカスタム分布を定義し、関数大中型企业
を使用して最尤推定を求めることもできます。たとえば,カスタム分布を打ち切りデータに近似するを参照してください。
確率分布オブジェクトを使用すると,確率分布による標本データへのあてはめと,パラメーター値の指定によって分布を定義できます。その後,分布オブジェクトに対してさまざまな解析を実行できます。
fitdist
を使用して確率分布オブジェクトで標本データを近似することにより,標本データから確率分布のパラメーターを推定します。指定した単一のパラメトリック分布またはノンパラメトリック分布を標本データにあてはめることができます。また,グループ化変数に基づいて,同じタイプの複数の分布を標本データにあてはめることもできます。fitdist
は,標本データから分布パラメーターを推定するために,ほとんどの分布には最尤推定法(标定)を使用します。詳細とその他の構文オプションについては,fitdist
を参照してください。
また,makedist
を使用してパラメーター値を指定することにより確率分布オブジェクトを作成することもできます。
確率分布オブジェクトを作成すると,オブジェクト関数を使用して以下を行うことができます。
確率分布オブジェクトを.MATファイルに保存するには,次のようにします。
ツールバーで[ワークスペースの保存)をクリックします。確率分布オブジェクトも含めて、ワークスペース内にあるすべての変数が保存されます。
ワークスペースブラウザーで確率分布オブジェクトを右クリックして,(名前を付けて保存)を選択します。選択した確率分布オブジェクトのみが保存されます。ワークスペース内にある他の変数は保存されません。
また,コマンドラインで関数保存
を使用して確率分布オブジェクトを直接保存できます。保存
は,ファイル名を選択し,保存する確率分布オブジェクトを指定できます。オブジェクト(または他の変数)を指定しなかった場合,確率分布オブジェクトを含めて,ワークスペース内にあるすべての変数が,指定したファイル名でMATLAB®によって保存されます。詳細とその他の構文オプションについては,保存
を参照してください。
この例では,確率分布オブジェクトを使用した,近似分布に対する多段階解析の実施方法を示します。
この解析では,次のことを行う方法を示します。
標本データを読み込みます。
负载examgrades
標本データは120行5列の行列で,試験の成績が格納されています。0 ~ 100試験の得点はのスケールです。
試験成績データの1列目が含まれているベクトルを作成します。
x =成绩(:1);
fitdist
を使用して確率分布オブジェクトを作成することにより,正規分布で標本データを近似します。
pd = fitdist (x,“正常”)
正态分布mu = 75.0083 [73.4321, 76.5846] sigma = 8.7202 [7.7391, 9.98843]
fitdist
は,NormalDistribution
型の確率分布オブジェクトpd
を返します。このオブジェクトには,近似した正規分布について推定したパラメーター値μ
およびσ
が含まれています。パラメーター推定の横にある区間は分布パラメーターの95%信頼区間です。
近似分布オブジェクトpd
を使用して,学生の試験成績の平均値を計算します。
m =意味着(pd)
m = 75.0083
試験成績の平均値は,fitdist
で推定したμ
パラメーターと等しくなります。
試験成績のヒストグラムをプロットします。あてはめた正規分布と実際の試験成績を視覚的に比較するため,あてはめたpdfのプロットを重ねます。
x_pdf = [1:0.1:100];y = pdf (pd, x_pdf);图直方图(x,“归一化”,“pdf”)线(x_pdf, y)
近似分布のpdfは,試験成績のヒストグラムと同じ形状になっています。
累積分布逆関数 (icdf
)を使用して,学生の試験成績の上位10%の境界を判別します。この境界は,確率分布のcdfが0.9に等しくなる値と同じです。つまり,90%の試験成績はこの境界値以下になります。
0.9 = icdf (pd)
一个= 86.1837
近似分布に基づくと,10%の学生の試験成績は86.1837より高くなっています。同様に,90%の学生は試験成績が86.1837以下です。
近似した確率分布pd
を,myobject.mat
という名前のファイルとして保存します。
保存(“myobject.mat”,“pd”)
分布特有の関数を使用して確率分布を処理することもできます。これらの関数は,乱数の生成,ループ内またはスクリプト内での要約統計の計算,它强调またはpdfを関数ハンドルとして別の関数に渡す操作に便利です。これらの関数は,単一のパラメーターセットだけでなく,パラメーター値の配列についての計算の実行にも使用できます。サポートされている確率分布の一覧については,サポートされている分布を参照してください。
この例では,分布特有の関数を使用した,近似分布に対する多段階解析の実施方法を示します。
この解析では,次のことを行う方法を示します。
確率分布オブジェクトを使用して,同じ解析を実行できます。確率分布オブジェクトの使用による分布の解析を参照してください。
標本データを読み込みます。
负载examgrades
標本データは120行5列の行列で,試験の成績が格納されています。0 ~ 100試験の得点はのスケールです。
試験成績データの1列目が含まれているベクトルを作成します。
x =成绩(:1);
normfit
を使用して,正規分布オブジェクトを標本データにあてはめます。
(μ、σmuCI sigmaCI] = normfit (x)
μ= 75.0083
σ= 8.7202
muCI =2×173.4321 - 76.5846
sigmaCI =2×17.7391 - 9.9884
関数normfit
は,正規分布パラメーターの推定値およびパラメーター推定値の95%信頼区間を返します。
試験成績のヒストグラムをプロットします。あてはめた正規分布と実際の試験成績を視覚的に比較するため,あてはめたpdfのプロットを重ねます。
x_pdf = [1:0.1:100];y = normpdf (x_pdf、μ、σ);图直方图(x,“归一化”,“pdf”)线(x_pdf, y)
近似分布のpdfは,試験成績のヒストグラムと同じ形状になっています。
正規累積分布逆関数を使用して,学生の試験成績の上位10%の境界を判別します。この境界は,確率分布のcdfが0.9に等しくなる値と同じです。つまり,90%の試験成績はこの境界値以下になります。
一个= norminv(0.9μ、σ)
一个= 86.1837
近似分布に基づくと,10%の学生の試験成績は86.1837より高くなっています。同様に,90%の学生は試験成績が86.1837以下です。
推定した分布パラメーターを,myparameter.mat
という名前のファイルとして保存します。
保存(“myparameter.mat”,“亩”,“σ”)
この例では,確率分布関数normcdf
をカイ二乗適合度検定(chi2gof
)で関数ハンドルとして使用する方法を示します。
この例では,入力ベクトルx
に含まれている標本データが正規分布に由来しており,この正規分布ではパラメーターµおよびσがそれぞれ標本データの平均(的意思是
)および標準偏差(性病
)に等しいという帰無仮説を検定します。
rng (“默认”)%的再现性x = normrnd (5100 1);h = chi2gof (x),“提供”, {@normcdf,意味着(x),性病(x)})
h = 0
h = 0
という結果は,5%という既定の有意水準でchi2gof
が帰無仮説を棄却しなかったことを示しています。
次の例では,確率分布関数をスライスサンプラー(slicesample
)で関数ハンドルとして使用する方法を示します。この例では,normpdf
2000年を使用して個の値がある無作為標本を標準正規分布から生成し,生成された値のヒストグラムをプロットします。
rng (“默认”)%的再现性x = slicesample (2000,“pdf”@normpdf,“薄”5,“燃烧”, 1000);直方图(x)
このヒストグラムは,normpdf
を使用した場合に生成される無作為標本が標準正規分布になることを示しています。
normpdf
ではなく指数分布pdfの確率分布関数(exppdf
)を関数ハンドルとして渡した場合,slicesample
はµが1に等しいという既定パラメーター値の指数分布から2000個の無作為標本を生成します。
rng (“默认”)%的再现性x = slicesample (2000,“pdf”@exppdf,“薄”5,“燃烧”, 1000);直方图(x)
このヒストグラムは,exppdf
を使用した場合に生成される無作為標本が指数分布になることを示しています。
アプリとユーザーインターフェイスを使用すると,パラメトリックおよびノンパラメトリックな確率分布を処理するための対話型のアプローチが可能となります。
分布更健康アプリでは,対話的に確率分布をデータにあてはめることができます。さまざまなタイプのプロットを表示し,信頼限界の計算,およびデータの近似を評価できます。また,近似からデータを除外することもできます。データを保存し,近似をワークスペースに確率分布オブジェクトとしてエクスポートして,さらに解析を行うことができます。
分布钳工アプリを読み込むには,[アプリ]タブを使用するか,コマンドウィンドウで”distributionFitter
“と入力します。詳細は,分布钳工アプリを使用したデータのモデリングを参照してください。
確率分布関数ユーザーインターフェイスでは,確率分布を視覚的に調べることができます。確率分布関数ユーザーインターフェイスを読み込むには、コマンド ウィンドウで「disttool
“と入力します。
乱数発生ユーザーインターフェイスでは,指定した分布から乱数データを発生させ,結果をワークスペースにエクスポートできます。このツールを使用すると,パラメーターと標本サイズの変更が分布に与える影響を調べることができます。
乱数発生ユーザーインターフェイスでは,分布のパラメーター値の設定と下限および上限の変更を行うこと,同じサイズおよびパラメーターを使用して同じ分布から別の標本を抽出すること,および詳しく解析するために無作為標本をワークスペースにエクスポートすることができます。ダイアログボックスにより,標本に名前を付けることができます。
fitdist
|makedist
|randtool
|分布更健康|確率分布関数