此示例显示如何将多个概率分布对象适合同一组样本数据,并获得每个分布适合数据的良好的视觉比较。
加载样本数据。
加载Carsmall.
此数据包含每加仑数英里(MPG.
)针对不同品牌和汽车型号的测量,由原产国分组(起源
),模型年(model_year.
)和其他车辆特征。
转变起源
进入分类数组并从示例数据中删除意大利汽车。因为只有一辆意大利汽车,Fitdist.
除了内核分布之外,不能拟合到该组的分发。
来源=分类(Cellstr(origin));MPG2 = MPG(Origin〜='意大利');Origin2 = Origin(Origin〜='意大利');Origin2 = Removecats(Origin2,'意大利');
采用Fitdist.
适用于每个原产国集团的Weibull,Normal,Logistic和Kernel分布MPG.
数据。
[Weibyorig,Country] = FITDIST(MPG2,'weibull'那'通过',origin2);[Normbyorig,Country] = Fitdist(MPG2,'正常'那'通过',origin2);[logbyorig,country] = fitdist(mpg2,'逻辑'那'通过',origin2);[kerbyorig,country] = fitdist(mpg2,'核心'那'通过',origin2);
Weibyorig
Weibyorig =.1×5个单元阵列列1到2 {1x1 prob.weibulldistibution} {1x1 prob.weibulldistibution}列3到4 {1x1 prob.weibulldistribution} {1x1 prob.weibulldistribution}第5栏{1x1 prob.weibulldistreibution}
国家
国家=5x1细胞{'france'} {'德国'} {'日本'} {'瑞典'} {美国'}
每个国家组现在都有四个与之相关的分发对象。例如,单元格数组Weibyorig
包含五个Weibull分发对象,一个用于示例数据中的每个国家/地区。同样,单元阵列规范Byorig
包含五个正常分布对象等。每个对象都包含包含有关数据,分发和参数信息的属性。阵列国家
以与分发对象存储在单元格阵列中的相同顺序中,为每个组列出每个组的原点国家。
提取美国的四个概率分布对象,并计算每个分布的PDF。如步骤3所示,USA在每个单元阵列中位于位置5。
weiusa = weibyorig {5};normuara = nammbyorig {5};logusa = logbyorig {5};kerusa = kerbyorig {5};x = 0:1:50;pdf_wei = pdf(weiusa,x);pdf_norm = pdf(normusa,x);pdf_log = pdf(logusa,x);pdf_ker = pdf(kerusa,x);
绘制每个分配适合美国数据的PDF,叠加在样本数据的直方图上。为更轻松的显示标准化直方图。
创建美国样本数据的直方图。
数据= MPG(Origin2 =='美国');图直方图(数据,10,'正常化'那'pdf'那'facecholor',[1,0.8,0]);
绘制每个拟合分布的PDF。
线(x,pdf_wei,'linestyle'那' - '那'颜色'那'r')线(x,pdf_norm,'linestyle'那' - 。'那'颜色'那'B')线(x,pdf_log,'linestyle'那' - '那'颜色'那'G')线(x,pdf_ker,'linestyle'那':'那'颜色'那'K')传奇('数据'那'weibull'那'正常'那'逻辑'那'核心'那'位置'那'最好')标题('来自美国的汽车MPG')Xlabel('mpg')
在样本数据的直方图上叠加PDF曲线,提供了每种类型的分布符合数据的视觉比较。只有非参数内核分布康短拉
靠近揭示原始数据中的两种模式。
调查步骤5中显示的两种模式,组MPG.
所有原产国的数据(起源
)和模型年(model_year.
和使用Fitdist.
适合每个组的内核分布。
[kerbyyearorig,names] = fitdist(mpg,'核心'那'通过',{OUSINO MODEM_YEAR});
Origin和Model年的每个独特组合现在都有一个与之相关的内核分发对象。
名称
名称=14x1细胞{'france ...'} {'france ...'} {'德国......'} {'德国......'} {'德国......'} {'意大利...'} {'日本...'} {'日本......'} {'日本......'} {'瑞典......'} {'瑞典......'} {'美国...'} {美国'} {美国。..' } {'美国...' }
绘制每个USA模型年的三个概率分布,它位于单元阵列中的位置12,13和14中KerbyYearorig
。
图持有上对于i = 12:14 plot(x,pdf(kerbyyearorig {i},x))结束传说('1970'那'1976'那'1982')标题(“美国汽车的MPG由模型年”)Xlabel('mpg'抱紧关闭
当由模型年进一步分组时,PDF地块揭示了两个不同的峰值MPG.
在美国制造的汽车数据 - 一个为1970年的模型年份,而且为1982年的模型年份。这解释了为什么每加仑数据组合的美国数英里的直方图显示两个峰值而不是一个。