主要内容

拟合概率分布对象到分组数据

这个示例展示了如何将概率分布对象与分组的样本数据拟合,并创建一个图来直观地比较每一组的pdf。

步骤1。加载示例数据。

加载示例数据。

负载Carsmall.

数据包括每加仑行驶的英里数(英里/加仑)按原产国分类的不同汽车制造商和型号的测量值(起源)、模型年(model_year.)和其他车辆特性。

步骤2。创建分类数组。

变换起源进入一个分类数组。

来源=分类(Cellstr(origin));

步骤3。拟合每个组的内核分布。

使用fitdist以适合的内核分布到每个原产国组英里/加仑数据。

[KerByOrig、国家]= fitdist(英里/加仑,“内核”“通过”,起源)
KerByOrig =1×6单元阵列列1到2 {1x1 prob.kerneltistribution} {1x1 prob.kerneldistribution}列3到4 {1x1 prob.kerneldistribution} {1x1 prob.kerneldistribution}列5到6 {1x1 prob.kerneldistribution} {1x1 prob.kerneldistribution}
国家=6 x1细胞{“法国”}{“德国”}{“意大利”}{‘日本’}{“瑞典”}{'美国'}

细胞数组KerByOrig包含6个内核分布对象,每个对象对应示例数据中表示的每个国家。每个对象都包含包含有关数据、分布和参数的信息的属性。数组国家以与存储分发对象相同的顺序列出每个组的原产国KerByOrig

步骤4。计算每个组的pdf。

提取德国、日本、美国的概率分布对象。使用每个国家的位置KerByOrig如图3所示,这表明德国是第二国家,日本是第四国家,美国是第六国家。计算每个组的pdf。

德国= KerByOrig {2};日本= KerByOrig {4};美国= KerByOrig {6};x = 0:1:50;USA_pdf = pdf(美国x);Japan_pdf = pdf(日本,x);Germany_pdf = pdf(德国,x);

第5步。绘制每组的pdf图。

将每组的pdf图绘制在同一个图上。

Plot(x,USA_PDF,的r -) 抓住情节(x, Japan_pdf,'B-。')情节(x, Germany_pdf凯西:”)({传奇“美国”“日本”“德国”},'地点''nw')标题(“按原产国划分的MPG”)xlabel(“英里”

结果图显示了每加仑汽油的英里数(英里/加仑)因原产国而异(起源).从这个数据可以看出,美国的分布最广,峰值在最低点英里/加仑价值的三个起源。日本的分布最规律,左尾稍重,峰值最高英里/加仑价值的三个起源。德国的峰值在美国和日本之间,第二个峰值接近每加仑44英里,这表明数据中可能存在多种模式。

另请参阅

|

相关话题