拟合概率分布对象到分组数据
这个例子展示了如何将概率分布对象拟合到分组的样本数据中,并创建一个图形来直观地比较每个组的pdf。
步骤1。加载样例数据。
加载样例数据。
负载carsmall;
数据包含每加仑英里数(英里/加仑
),以原产国分类的不同品牌和型号的汽车尺寸(起源
)、型号年份(Model_Year
),以及其他车辆特征。
步骤2。创建一个分类数组。
变换起源
变成一个分类数组。
Origin = categorical(cellstr(Origin));
步骤3。为每个组匹配内核分布。
使用fitdist
中每个原产国组的内核分布拟合英里/加仑
数据。
[KerByOrig,Country] = fitdist(MPG,“内核”,“通过”起源)
KerByOrig =1×6单元格数组列1到2 {1x1问题。{1x1问题。KernelDistribution}Columns 3 through 4 {1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution} Columns 5 through 6 {1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution}
国家=6 x1细胞{“法国”}{“德国”}{“意大利”}{‘日本’}{“瑞典”}{'美国'}
单元格数组KerByOrig
包含六个内核分布对象,在示例数据中表示的每个国家对应一个。每个对象都包含包含数据、分布和参数信息的属性。数组国家
按照存储分布对象的顺序列出每个组的原产国KerByOrig
.
步骤4。计算每个组的pdf。
提取德国、日本和美国的概率分布对象。使用每个国家的位置KerByOrig
如图3所示,其中德国是第二个国家,日本是第四个国家,美国是第六个国家。计算每个组的pdf。
德国= KerByOrig{2};日本= KerByOrig{4};美国= KerByOrig{6};X = 0:1:50;USA_pdf = pdf(美国,x);Japan_pdf = pdf(日本,x);Germany_pdf = pdf(德国,x);
第5步。为每组绘制pdf图。
在同一图表上绘制每组的pdf。
情节(x, USA_pdf,的r -)举行在情节(x, Japan_pdf,b -。)情节(x, Germany_pdf凯西:”)({传奇“美国”,“日本”,“德国”},“位置”,“西北”)标题(“按原产国划分的MPG”)包含(“英里”)
由此得出的图表显示了每加仑(英里/加仑
)的表现因国家而异(起源
).使用该数据,美国的分布最广,峰值在最低处英里/加仑
价值的三个来源。日本的分布最规律,左尾稍重,其峰值在最高点英里/加仑
价值的三个来源。德国的峰值位于美国和日本之间,而第二次接近每加仑44英里的峰值表明,数据中可能存在多种模式。