拟合概率分布对象到分组数据

这个示例展示了如何将概率分布对象与分组的样本数据拟合，并创建一个图来直观地比较每一组的pdf。

步骤1。加载示例数据。

加载示例数据。

负载Carsmall.；

数据包括每加仑行驶的英里数(英里/加仑)按原产国分类的不同汽车制造商和型号的测量值(起源)、模型年(model_year.)和其他车辆特性。

步骤2。创建分类数组。

变换起源进入一个分类数组。

来源=分类（Cellstr（origin））;

步骤3。拟合每个组的内核分布。

使用fitdist以适合的内核分布到每个原产国组英里/加仑数据。

[KerByOrig、国家]= fitdist(英里/加仑,“内核”，“通过”，起源）

KerByOrig =1×6单元阵列列1到2 {1x1 prob.kerneltistribution} {1x1 prob.kerneldistribution}列3到4 {1x1 prob.kerneldistribution} {1x1 prob.kerneldistribution}列5到6 {1x1 prob.kerneldistribution} {1x1 prob.kerneldistribution}

国家=6 x1细胞{“法国”}{“德国”}{“意大利”}{‘日本’}{“瑞典”}{'美国'}

细胞数组KerByOrig包含6个内核分布对象，每个对象对应示例数据中表示的每个国家。每个对象都包含包含有关数据、分布和参数的信息的属性。数组国家以与存储分发对象相同的顺序列出每个组的原产国KerByOrig．

步骤4。计算每个组的pdf。

提取德国、日本、美国的概率分布对象。使用每个国家的位置KerByOrig如图3所示，这表明德国是第二国家，日本是第四国家，美国是第六国家。计算每个组的pdf。

德国= KerByOrig {2};日本= KerByOrig {4};美国= KerByOrig {6};x = 0:1:50;USA_pdf = pdf(美国x);Japan_pdf = pdf(日本,x);Germany_pdf = pdf(德国,x);

第5步。绘制每组的pdf图。

将每组的pdf图绘制在同一个图上。

Plot（x，USA_PDF，的r -） 抓住在情节(x, Japan_pdf,'B-。')情节(x, Germany_pdf凯西:”)({传奇“美国”，“日本”，“德国”}，'地点'，'nw')标题(“按原产国划分的MPG”）xlabel（“英里”）

结果图显示了每加仑汽油的英里数(英里/加仑)因原产国而异(起源）.从这个数据可以看出，美国的分布最广，峰值在最低点英里/加仑价值的三个起源。日本的分布最规律，左尾稍重，峰值最高英里/加仑价值的三个起源。德国的峰值在美国和日本之间，第二个峰值接近每加仑44英里，这表明数据中可能存在多种模式。

另请参阅

fitdist|pdf

拟合概率分布对象到分组数据

步骤1。加载示例数据。

步骤2。创建分类数组。

步骤3。拟合每个组的内核分布。

步骤4。计算每个组的pdf。

第5步。绘制每组的pdf图。

另请参阅

相关话题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一步一步的指导与MATLAB