概率分布

根据实验数据建立概率模型

概率分布是数学模型把概率分配给随机变量. 它们可用于模拟实验或历史数据,以便生成预测估计或分析大量结果,如蒙特卡洛模拟。

概率分布主要有两种类型:参数分布和非参数分布。

参数分布概率分布可以用一个带有有限参数集的方程来描述。对于指定的参数分布,通过拟合数据来估计参数。一些常见的参数分布包括:

  • 正态(或高斯)分布
  • 威布尔分布
  • 广义极值分布
  • 物流配送
  • 核分布
  • Copulas(多元分布)

非参数分布概率分布是提供纯粹基于样本数据的概率密度函数估计的概率分布。当数据不能由参数分布精确描述时,这是首选方法。一些常见的非参数概率分布包括:

  • 核分布
  • 经验累积分布
  • 分段线性分布
  • 带Pareto尾的分段分布
  • 三角分布

利用极大似然估计,参数分布可以很容易地拟合数据。然后,通过计算汇总统计数据、评估概率密度函数(PDF)和累积分布函数(CDF)以及评估分布与数据的拟合程度,使用拟合分布来执行进一步的分析。

有关分布类型、分布拟合、可视化分布和生成随机数的详细信息,请参见统计与机器学习工具箱™用于MATLAB软件®.

另请参见:统计与机器学习工具箱,机器学习,随机数,数据拟合,数据分析,数学建模