从实验数据建立概率模型

概率分布是数学模型把概率赋值给a随机变量。它们可以用于模拟实验数据或历史数据,以生成预测估计或分析大量结果,如in蒙特卡罗模拟。

概率分布有两种主要类型:参数型和非参数型。

参数分布是概率分布,可以用一个有限参数集的方程来描述。对于给定的参数分布,通过对数据的拟合来估计参数。一些常见的参数分布包括:

  • 正态(或高斯)分布
  • 威布尔分布
  • 广义极值(GEV)分布
  • 物流配送
  • 内核分配
  • 连系动词(多元分布)

非参数分布是概率分布,它提供纯粹基于样本数据的概率密度函数的估计。当参数分布不能准确描述数据时,这是首选的。一些常见的非参数概率分布包括:

  • 内核分配
  • 经验累积分布
  • 分段线性分布
  • 具有帕累托尾的分段分布
  • 三角形分布

利用极大似然估计,参数分布可以很容易地拟合数据。然后,通过计算汇总统计数据、评估概率密度函数(PDF)和累积分布函数(CDF)以及评估分布与数据的匹配度,使用拟合后的分布进行进一步分析。

有关分布类型、分布拟合、分布可视化和随机数生成的更多信息,请参见统计和机器学习工具箱™使用MATLAB®

参见:统计和机器学习工具箱,机器学习,随机数,数据拟合,数据分析,数学建模