主要内容

拟合概率分布对象到分组数据

这个例子展示了如何将概率分布对象拟合到分组的样本数据中,并创建一个图形来直观地比较每个组的pdf。

步骤1。加载样例数据。

加载样例数据。

负载carsmall

数据包含每加仑英里数(英里/加仑),以原产国分类的不同品牌和型号的汽车尺寸(起源)、型号年份(Model_Year),以及其他车辆特征。

步骤2。创建一个分类数组。

变换起源变成一个分类数组。

Origin = categorical(cellstr(Origin));

步骤3。为每个组匹配内核分布。

使用fitdist中每个原产国组的内核分布拟合英里/加仑数据。

[KerByOrig,Country] = fitdist(MPG,“内核”“通过”起源)
KerByOrig =1×6单元格数组列1到2 {1x1问题。{1x1问题。KernelDistribution}Columns 3 through 4 {1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution} Columns 5 through 6 {1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution}
国家=6 x1细胞{“法国”}{“德国”}{“意大利”}{‘日本’}{“瑞典”}{'美国'}

单元格数组KerByOrig包含六个内核分布对象,在示例数据中表示的每个国家对应一个。每个对象都包含包含数据、分布和参数信息的属性。数组国家按照存储分布对象的顺序列出每个组的原产国KerByOrig

步骤4。计算每个组的pdf。

提取德国、日本和美国的概率分布对象。使用每个国家的位置KerByOrig如图3所示,其中德国是第二个国家,日本是第四个国家,美国是第六个国家。计算每个组的pdf。

德国= KerByOrig{2};日本= KerByOrig{4};美国= KerByOrig{6};X = 0:1:50;USA_pdf = pdf(美国,x);Japan_pdf = pdf(日本,x);Germany_pdf = pdf(德国,x);

第5步。为每组绘制pdf图。

在同一图表上绘制每组的pdf。

情节(x, USA_pdf,的r -)举行情节(x, Japan_pdf,b -。)情节(x, Germany_pdf凯西:”)({传奇“美国”“日本”“德国”},“位置”“西北”)标题(“按原产国划分的MPG”)包含(“英里”

图中包含一个轴对象。标题为“MPG by Country of Origin”的axes对象包含3个类型为line的对象。这些物品代表美国、日本、德国。

由此得出的图表显示了每加仑(英里/加仑)的表现因国家而异(起源).使用该数据,美国的分布最广,峰值在最低处英里/加仑价值的三个来源。日本的分布最规律,左尾稍重,其峰值在最高点英里/加仑价值的三个来源。德国的峰值位于美国和日本之间,而第二次接近每加仑44英里的峰值表明,数据中可能存在多种模式。

另请参阅

|

相关的话题