主要内容

使用概率分布

概率分布理论分布是基于假设人口来源。分配概率分布随机变量都有一个特定的事件,离散值,或落在指定范围的连续值。

统计和机器学习工具箱™提供了几种方法和概率分布。

发行版支持的列表统计和机器学习工具箱,明白了金宝app金宝app支持分布

概率分布对象

概率分布对象允许您适合样本数据的概率分布,或定义一个分布通过指定参数值。您可以执行各种分析分布对象。

创建概率分布对象

从样本数据估计概率分布参数通过数据拟合概率分布对象使用fitdist。你可以适应一个指定的参数或非参数样本数据分布。你也可以适应多个相同类型的分布样本数据基于分组变量。对于大多数发行版,fitdist使用最大似然估计(企业)来估计样本数据的分布参数。和额外的语法选项的更多信息,参见fitdist

或者,您可以创建一个概率分布对象使用指定的参数值makedist

使用概率分布对象

一旦你创建一个概率分布对象,您可以使用对象的功能:

  • 计算分布参数的置信区间(paramci)。

  • 计算汇总统计,包括的意思(的意思是),中等(中位数),四分位范围(位差)、方差(var)和标准差(性病)。

  • 评估的概率密度函数(pdf)。

  • 评价累积分布函数(提供)或逆累积分布函数(icdf)。

  • 计算负loglikelihood (negloglik)和概要似然函数(proflik)的分布。

  • 生成随机数的分布(随机)。

  • 截断上下限制(指定的分布截断)。

保存一个概率分布对象

保存您的概率分布对象.MAT文件:

  • 在工具栏中,单击保存工作空间。这个选项保存工作空间中的所有变量,包括任何概率分布对象。

  • 在工作空间浏览器中,右键单击该对象并选择概率分布另存为。此选项只保存选中的概率分布对象,不是工作区中的其他变量。

或者,您可以保存一个概率分布对象直接从命令行通过使用保存函数。保存使您能够选择一个文件名,并指定您想保存的概率分布对象。如果你不指定一个对象(或其他变量),MATLAB®保存工作空间中的所有变量,包括任何概率分布对象指定的文件名。和额外的语法选项的更多信息,参见保存

分析使用概率分布对象分布

这个例子展示了如何使用概率分布对象执行多步分析拟合分布。

分析说明:

  • 合适的样本数据的概率分布,其中包含120名学生的考试成绩fitdist

  • 考试成绩的均值计算通过使用的意思是

  • 画一个柱状图的考试成绩数据,覆盖的情节的pdf安装分布,利用情节pdf

  • 计算边界的前10%的学生成绩通过icdf

  • 保存安装对象通过使用概率分布保存

加载示例数据。

负载examgrades

样本数据包含120 - 5矩阵的考试成绩。考试分数在0到100的规模。

创建一个包含考试成绩数据的第一列向量。

x =成绩(:1);

符合正态分布的样本数据fitdist创建一个概率分布对象。

pd = fitdist (x,“正常”)
pd = NormalDistribution正态分布μ= 75.0083[73.4321,76.5846]σ= 8.7202 (7.7391,9.98843)

fitdist返回一个概率分布对象,pd的类型NormalDistribution。这个对象包含估计参数值,μσ,符合正态分布。旁边的间隔参数估计的95%置信区间的分布参数。

学生考试成绩计算的均值使用安装分布对象,pd

m =意味着(pd)
m = 75.0083

考试成绩的均值等于μ参数估计fitdist

画一个柱状图的考试成绩。覆盖安装pdf的情节来直观地比较符合正态分布与实际考试成绩。

x_pdf = [1:0.1:100];y = pdf (pd, x_pdf);图直方图(x,“归一化”,“pdf”)线(x_pdf, y)

图包含一个坐标轴对象。坐标轴对象包含2直方图类型的对象。

pdf安装分布遵循相同的形状的直方图考试成绩。

确定的边界上10%的学生考试成绩使用逆累积分布函数(icdf)。这个边界相当于提供的价值的概率分布等于0.9。换句话说,90%的考试成绩是小于或等于边界值。

0.9 = icdf (pd)
一个= 86.1837

基于拟合分布,10%的学生收到考试成绩大于86.1837。同样,90%的学生收到了考试成绩小于或等于86.1837。

保存安装概率分布,pd作为一个文件命名myobject.mat

保存(“myobject.mat”,“pd”)

应用程序和交互式用户界面

应用程序和用户界面提供了一个交互式处理参数和非参数概率分布的方法。

  • 使用分布更健康应用交互式地适合样本数据的分布,并导出一个概率分布对象的工作区。

  • 使用概率分布函数用户界面直观地探索影响pdf和cdf改变分布参数值。

  • 使用随机数生成用户界面(randtool)从一个概率分布交互地生成随机数与指定的参数值,并将它们导出到工作空间。

分配适当的应用程序

分布更健康应用程序允许您交互式地适合您的数据的概率分布。您可以显示不同类型的情节,计算置信界限),并评估数据的配合。你也可以排除数据符合。你可以保存数据,将适合您的工作区导出为一个概率分布对象进行进一步分析。

负荷分布健康应用程序从应用程序选项卡,或通过输入distributionFitter在命令窗口中。有关更多信息,请参见使用健康应用分布模型数据

分配的默认视图装配应用程序

概率分布函数的工具

概率分布函数用户界面视觉探索概率分布。你可以加载用户界面输入概率分布函数disttool在命令窗口中。

概率分布函数的默认视图的工具

随机数生成工具

随机数生成用户界面生成随机指定的数据分布结果和出口到您的工作区。您可以使用这个工具来探索的影响改变参数和样本大小的分布。

随机数生成用户界面允许您设置参数值的分布和改变他们的上下界限;再画一个样本相同的分布,使用相同的大小和参数;和导出当前随机样本工作区用于进一步分析。一个对话框使您可以提供一个名称为样本。

默认的随机数生成工具

特定函数和泛型分布函数

使用特定函数和泛型分布函数用于生成随机数,计算汇总统计在一个循环或脚本,并通过提供或pdf函数处理另一个函数。您还可以使用这些函数来执行计算数组参数值,而不是一组参数。

  • 特定功能,一些支持的分布具有特定的功能。金宝app这些函数使用以下缩写,如normpdf,normcdf,norminv,normstat,normfit,normlike,normrnd:

    • pdf——概率密度函数

    • 提供——累积分布函数

    • 发票——逆累积分布函数

    • 统计——分布统计信息功能

    • 适合——分布健康功能

    • 就像- - - - - - - loglikelihood功能

    • rnd——随机数生成器

  • 通用的分布函数,使用提供,icdf,大中型企业,pdf,随机与指定名称和分布参数。

分析使用特定函数分布

这个例子展示了如何使用特定函数执行多步分析拟合分布。

分析说明:

  • 合适的样本数据的概率分布,其中包含120名学生的考试成绩normfit

  • 画一个柱状图的考试成绩数据,覆盖的情节的pdf安装分布,利用情节normpdf

  • 计算边界的前10%的学生成绩通过norminv

  • 通过使用保存估计分布参数保存

您可以使用一个概率分布执行相同的分析对象。看到分析使用概率分布对象分布

加载示例数据。

负载examgrades

样本数据包含120 - 5矩阵的考试成绩。考试分数在0到100的规模。

创建一个包含考试成绩数据的第一列向量。

x =成绩(:1);

符合正态分布的样本数据normfit

(μ、σmuCI sigmaCI] = normfit (x)
μ= 75.0083
σ= 8.7202
muCI =2×173.4321 - 76.5846
sigmaCI =2×17.7391 - 9.9884

normfit函数返回正态分布参数的估计和参数估计的95%置信区间。

画一个柱状图的考试成绩。覆盖安装pdf的情节来直观地比较符合正态分布与实际考试成绩。

x_pdf = [1:0.1:100];y = normpdf (x_pdf、μ、σ);图直方图(x,“归一化”,“pdf”)线(x_pdf, y)

图包含一个坐标轴对象。坐标轴对象包含2直方图类型的对象。

pdf安装分布遵循相同的形状的直方图考试成绩。

确定的边界上10%的学生考试成绩通过使用正常的逆累积分布函数。这个边界相当于提供的价值的概率分布等于0.9。换句话说,90%的考试成绩是小于或等于边界值。

一个= norminv(0.9μ、σ)
一个= 86.1837

基于拟合分布,10%的学生收到考试成绩大于86.1837。同样,90%的学生收到了考试成绩小于或等于86.1837。

将估计分布参数保存为一个文件命名myparameter.mat

保存(“myparameter.mat”,“亩”,“σ”)

使用概率分布函数作为函数句柄

这个例子展示了如何使用概率分布函数normcdf作为一个函数处理卡方拟合优度检验(chi2gof)。

这个示例测试零假设,样本数据中包含的输入向量,x来自正态分布与参数µσ等于的意思(的意思是)和标准差(性病分别)的示例数据。

rng (“默认”)%的再现性x = normrnd (5100 1);h = chi2gof (x),“提供”,{@normcdf,意味着(x),性病(x)})
h = 0

返回的结果h = 0表明chi2gof不拒绝零假设默认的5%显著性水平。

下一个示例演示了如何使用概率分布函数作为函数处理片取样器(slicesample)。本例使用normpdf生成一个随机抽取的2000名从标准正态分布值,和情节的直方图生成的值。

rng (“默认”)%的再现性x = slicesample (2000,“pdf”@normpdf,“薄”5,“燃烧”,1000);直方图(x)

图包含一个坐标轴对象。坐标轴对象包含一个直方图类型的对象。

直方图显示,当使用normpdf,由此产生的随机样本的标准正态分布。

如果你通过概率分布函数为指数分布的pdf (exppdf)作为一个函数处理代替normpdf,然后slicesample生成2000个随机样本一个默认参数值的指数分布µ等于1。

rng (“默认”)%的再现性x = slicesample (2000,“pdf”@exppdf,“薄”5,“燃烧”,1000);直方图(x)

图包含一个坐标轴对象。坐标轴对象包含一个直方图类型的对象。

直方图显示,使用时产生的随机样本exppdf有一个指数分布。

另请参阅

||||

相关的话题