拟合概率分布对象到分组数据

打开实时脚本

这个例子展示了如何将概率分布对象拟合到分组的样本数据中，并创建一个图形来直观地比较每个组的pdf。

步骤1。加载样例数据。

加载样例数据。

负载carsmall；

数据包含每加仑英里数(英里/加仑)，以原产国分类的不同品牌和型号的汽车尺寸(起源)、型号年份(Model_Year)，以及其他车辆特征。

步骤2。创建一个分类数组。

变换起源变成一个分类数组。

Origin = categorical(cellstr(Origin));

步骤3。为每个组匹配内核分布。

使用fitdist中每个原产国组的内核分布拟合英里/加仑数据。

[KerByOrig,Country] = fitdist(MPG，“内核”，“通过”起源)

KerByOrig =1×6单元格数组列1到2 {1x1问题。{1x1问题。KernelDistribution}Columns 3 through 4 {1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution} Columns 5 through 6 {1x1 prob.KernelDistribution} {1x1 prob.KernelDistribution}

国家=6 x1细胞{“法国”}{“德国”}{“意大利”}{‘日本’}{“瑞典”}{'美国'}

单元格数组KerByOrig包含六个内核分布对象，在示例数据中表示的每个国家对应一个。每个对象都包含包含数据、分布和参数信息的属性。数组国家按照存储分布对象的顺序列出每个组的原产国KerByOrig．

步骤4。计算每个组的pdf。

提取德国、日本和美国的概率分布对象。使用每个国家的位置KerByOrig如图3所示，其中德国是第二个国家，日本是第四个国家，美国是第六个国家。计算每个组的pdf。

德国= KerByOrig{2};日本= KerByOrig{4};美国= KerByOrig{6};X = 0:1:50;USA_pdf = pdf(美国，x);Japan_pdf = pdf(日本，x);Germany_pdf = pdf(德国，x);

第5步。为每组绘制pdf图。

在同一图表上绘制每组的pdf。

情节(x, USA_pdf,的r -)举行在情节(x, Japan_pdf,b -。)情节(x, Germany_pdf凯西:”)({传奇“美国”，“日本”，“德国”}，“位置”，“西北”)标题(“按原产国划分的MPG”)包含(“英里”）

图中包含一个轴对象。标题为“MPG by Country of Origin”的axes对象包含3个类型为line的对象。这些物品代表美国、日本、德国。

由此得出的图表显示了每加仑(英里/加仑)的表现因国家而异(起源)．使用该数据，美国的分布最广，峰值在最低处英里/加仑价值的三个来源。日本的分布最规律，左尾稍重，其峰值在最高点英里/加仑价值的三个来源。德国的峰值位于美国和日本之间，而第二次接近每加仑44英里的峰值表明，数据中可能存在多种模式。

另请参阅

pdf|fitdist