核平滑函数估计单变量和双变量数据
生成从两个正态分布的混合物的样本数据集。
RNG('默认')%用于重现X = [randn(30,1);5 + randn(30,1)];
画出估算的浓度。
[f, xi] = ksdensity (x);图情节(XI中,f);
密度估计显示了样品的双峰性。
从半正态分布中生成非负样本数据集。
RNG('默认')%用于重现PD = makedist('HalfNormal',“亩”,0,“西格玛”,1);X =随机(PD,100,1);
概率密度函数与两个不同的边界校正方法,对数变换和反射估算,通过使用“BoundaryCorrection”
名称 - 值对的参数。
PTS = linspace(0,5,1000);%点来评估估计[F1,XI1] = ksdensity(X,PTS,'金宝app支持',“积极”);[F2,XI2] = ksdensity(X,PTS,'金宝app支持',“积极”,“BoundaryCorrection”,'反射');
画出两个估计的PDF文件。
情节(XI1,F1,XI2,F2)LGD =图例(“日志”,'反射');标题(LGD,“边界校正方法”) xl = xlim;xlim ([-0.25 xl xl (1) (2)))
ksdensity
在指定正支持或有界支持时使用边界校正方法。金宝app默认的边界修正方法是log变换。当ksdensity
转换背部支撑,介绍了金宝app1 / x
长期在内核密度估计。因此,估计有接近峰值x = 0的
。在另一方面,反射方法不会导致的边界附近不希望的峰值。
加载样本数据。
加载医院
计算并绘制估计CDF在指定的一组值进行评价。
分= (min (hospital.Weight): 2:马克斯(hospital.Weight));图()ecdf (hospital.Weight)上并[f,XI,BW] = ksdensity(hospital.Weight,PTS,'金宝app支持',“积极”,...'功能','CDF');图(十一,F,'-G','行宽',2)图例(“经验CDF”,'内核-BW:默认',“位置”,'西北')xlabel(“患者体重”)ylabel(“估计CDF”)
ksdensity
似乎顺利累积分布函数估计太多。具有较小带宽的估计可能会产生更紧密的估计与经验累积分布函数。
返回平滑窗口的带宽。
BW
BW = 0.1070
绘制使用较小的带宽累积分布函数估计。
并[f,Ⅺ] = ksdensity(hospital.Weight,PTS,'金宝app支持',“积极”,...'功能','CDF','带宽',0.05);图(十一,F,“——r”,'行宽',2)图例(“经验CDF”,'内核-BW:默认',“kernel-bw: 0.05”,...“位置”,'西北')保持离
该ksdensity
估计与较小的带宽经验累积分布函数更好匹配。
加载样本数据。
加载医院
绘制所估计的CDF在50点等距间隔的点进行评价。
图()ksdensity (hospital.Weight,'金宝app支持',“积极”,'功能','CDF',...“NumPoints”,50)xlabel(“患者体重”)ylabel(“估计CDF”)
从均值为3的指数分布中生成样本数据。
RNG('默认')%用于重现随机(x ='EXP',3100,(1);
创建一个表示审查的逻辑向量。在这里,寿命超过10年的观测结果被审查。
T = 10;经社=(X> T);
计算并绘制估计的密度函数。
图ksdensity (x,'金宝app支持',“积极”,“截尾”岑);
计算并绘制幸存者功能。
图ksdensity (x,'金宝app支持',“积极”,“截尾”岑,...'功能','幸存者');
计算并绘制累积危险函数。
图ksdensity (x,'金宝app支持',“积极”,“截尾”岑,...'功能','cumhazard');
生成两个正态分布的混合物,并绘制在指定的一组概率值的所估计的逆累积分布函数。
RNG('默认')%用于重现X = [randn(30,1);5 + randn(30,1)];PI = linspace(0.01,.99,99);图ksdensity(X,P1,'功能','ICDF');
生成两个正态分布的混合物。
RNG('默认')%用于重现X = [randn(30,1);5 + randn(30,1)];
返回平滑窗口的带宽的概率密度估计。
并[f,XI,BW] = ksdensity(X);BW
BW = 1.5141
默认带宽是最佳的正常密度。
画出估算的浓度。
图情节(XI中,f);xlabel(“十一”)ylabel('F')保持上
使用增加的带宽值绘制密度。
并[f,Ⅺ] = ksdensity(X,'带宽',1.8);图(十一,F,“——r”,'行宽'1.5)
更高的带宽进一步平滑了密度估计,这可能掩盖了分布的一些特性。
现在,绘制使用减少的带宽值的密度。
并[f,Ⅺ] = ksdensity(X,'带宽',0.8);图(十一,F,'-.k','行宽'传说,1.5)(“bw =违约”,'BW = 1.8','BW = 0.8')保持离
较小的带宽平滑的密度估计值更小,这夸大了样品的一些特性。
创建在该评估密度点的一个两列向量。
gridx1 = -0.25:0.05:1.25;gridx2 = 0:0.1:15;[X1,X2] = meshgrid(gridx1,gridx2);X1 = X1(:);X2 = X2(:);XI = [X1 X2];
产生从二元正态分布的混合物包含随机数的30×2矩阵。
RNG('默认')%用于重现x = [0+ 5*rand(20,1) 5+2.5*rand(20,1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];
绘制样本数据的估计密度。
图ksdensity(X,XI);
X
-样本数据分
-点,其评估F
斧头
-轴处理图形的轴句柄ksdensity
阴谋,指定为把手。
例如,如果H
是一个数字的句柄,然后ksdensity
可以绘制出如下图。
例:ksdensity(H,X)
指定可选的用逗号分隔的对名称,值
参数。的名字
是参数的名称和值
是对应的值。的名字
必须出现引号内。您可以按照任何顺序指定多个名称和值对参数名1,值1,...,NameN,值N
。
'截尾',经社, '核心', '三角形', '为NumPoints',20, '功能', 'CDF'
该指定ksdensity
利用三角形核平滑函数,并考虑矢量中的截尾数据信息,对覆盖数据范围的20个等间距点进行评价,从而估计cdfCENS
。
“BoundaryCorrection”
-边界修正法边界校正方法,指定为逗号分隔的一对组成的“BoundaryCorrection”
和“日志”
要么'反射'
。
值 | 描述 |
---|---|
“日志” |
的价值 |
'反射' |
|
ksdensity
仅当您指定时应用边界校正'金宝app支持'
作为以外的值“无界”
。
例:“BoundaryCorrection”、“反射”
“截尾”
-逻辑向量指示哪个条目被审查,指定为逗号分隔的一对组成的逻辑矢量“截尾”
和一个二进制值的向量。0表示没有截尾,1表示观察被截尾。默认是没有审查。此名称 - 值对只适用于单变量的数据。
例:'截尾',censdata
数据类型:合乎逻辑
'功能'
-函数来估计'PDF'
(默认)|'CDF'
|'ICDF'
|'幸存者'
|'cumhazard'
函数要估计,指定为由逗号分隔的对组成'功能'
与下列情况之一。
值 | 描述 |
---|---|
'PDF' |
概率密度函数。 |
'CDF' |
累积分布函数。 |
'ICDF' |
逆累积分布函数。 此值仅适用于单变量数据是有效的。 |
'幸存者' |
存活函数。 |
'cumhazard' |
累积风险的功能。 此值仅适用于单变量数据是有效的。 |
例:'功能'
,'ICDF'
'核心'
-核光滑器的类型'正常'
(默认)|“盒子”
|'三角形'
|'epanechnikov'
|功能手柄|特征向量|字符串标量类型的内核平滑的,指定为逗号分隔的一对组成的'核心'
与下列情况之一。
'正常'
(默认)
“盒子”
'三角形'
'epanechnikov'
内核函数是一个自定义或内置功能。指定的函数作为函数手柄(例如,@myfunction
要么@normpdf
),或者作为一个字符向量或标量的字符串(例如,'MyFunction的'
要么'normpdf'
)。该软件使用一个参数调用指定的函数,该参数是数据值与计算密度的位置之间的距离数组。函数必须返回包含内核函数相应值的相同大小的数组。
当'功能'
是'PDF'
,内核函数返回密度值。否则,它返回累积概率值。
指定自定义内核时'功能'
是'ICDF'
返回一个错误。
对于双变量数据,ksdensity
应用相同的内核每个维度。
例:“核心”,“盒子”
“NumPoints”
-的等距点数在等距点数喜
,指定为逗号分隔的一对组成的“NumPoints”
和一个标量值。此名称 - 值对只适用于单变量的数据。
例如,对于一个内核在采样数据,输入的范围内的80个间隔的点平滑指定功能的估计:
例:'为NumPoints',80
数据类型:单
|双
'金宝app支持'
-金宝app支持密度“无界”
(默认)|“积极”
|两个元素的向量,[L C]
|2乘2矩阵,[L1 L2;U1 U2]
金宝app支持密度,指定为逗号分隔的一对组成的'金宝app支持'
与下列情况之一。
值 | 描述 |
---|---|
“无界” |
默认。允许密度,延长了整个实线。 |
“积极” |
限制密度为正值。 |
双元素向量,[L C] |
给出了支持密度的有限下界和上界。金宝app此选项仅适用于单变量的样本数据。 |
二对二矩阵,[L1 L2;U1 U2] |
给出了支持密度的有限下界和上界。金宝app第一行包含下限,第二行包含上限。此选项仅对双变量样本数据有效。 |
对于双变量数据,'金宝app支持'
可以指定为正,无界的,或有界变量的组合[0 -Inf;天道酬勤天道酬勤]
要么[0 L,天道酬勤ù]
。
例:“金宝app支持”,“积极”
例:'金宝app支持',[0 10]
数据类型:单
|双
|烧焦
|字符串
“权重”
-权重样本数据BW
- 平滑窗口的带宽平滑窗口的带宽,作为标量值返回。
如果您指定“BoundaryCorrection”
如“日志”
(默认)和'金宝app支持'
因为无论是“积极”
或载体[L C]
,ksdensity
使用日志转换将有界数据转换为无界数据。的价值BW
是在变换值的比例。
内核分配是随机变量的概率密度函数(pdf)的非参数表示。当你想避免对数据分布的假设您可以使用一个内核分配时,参数分布不能正确地描述数据,或。内核分布由平滑函数和一个带宽值,该控制所得到的密度曲线的平滑性所定义。
核密度估计器是随机变量的估计pdf。对于任何的实值X,内核密度估计公式由下式给出
在哪里X1,X2,...,Xñ是从一个未知分布的随机样本,ñ为样本大小, 是内核的平滑函数和H是带宽。
核估计的累积分布函数(CDF),对任何真正的价值X, 是(谁)给的
在哪里 。
有关详细信息,请参阅内核分配。
反射法是正确查找核密度估计时的随机变量具有有界支撑的边界校正方法。金宝app如果您指定“BoundaryCorrection”、“反射”
,ksdensity
使用反射法。该方法增强件通过将边界附近的反射数据界定数据,并且估计的PDF。然后,ksdensity
以适当的规格化方法返回与原始支持项对应的估计pdf,从而使估计的pdf对原始支持项的积分等于1。金宝app
如果另外指定'金宝app支持',[L C]
, 然后ksdensity
找到内核估计器,如下所示。
如果'功能'
是'PDF'
,那么内核密度估计是
对于大号≤X≤ü,
在哪里
,
和X一世是个一世
个样本的数据。
如果'功能'
是'CDF'
,那么CDF核估计是
对于大号≤X≤ü。
以获取内核估计器,用于逆CDF,一个幸存者函数,或一个累积危险功能(当'功能'
是'ICDF'
,'幸存者'
,或'cumhazrd'
)ksdensity
同时使用
和
。
如果另外指定'金宝app支持'
如“积极”
要么[0 INF]
, 然后ksdensity
通过更换发现核估计[L C]
同[0 INF]
在上面的方程中。
[1]鲍曼,A. W.,和A. Azzalini。应用平滑技术进行数据分析。纽约:牛津大学出版公司,1997。
[2]山,P.D。“分布函数的核估计”。理论与方法 - 统计通讯。第14卷,第。3,1985年,第605-620。
[3]琼斯,M. C.“核密度估计的简单边界校正”。统计与计算。卷。3,第3期,1993,第135-146。
[4]西尔弗曼,B.W。密度估计统计和数据分析。查普曼和霍尔/ CRC,1986。
此功能支持用于与一些限制内存金宝app不足数据高大阵列。
不支持一些需要额外传递或对输入数据进行排序的选项:金宝app
“BoundaryCorrection”
“截尾”
'金宝app支持'
(金宝app支持无限总是)。
使用标准偏差(而不是中位数绝对偏差)来计算带宽。
欲了解更多信息,请参阅对于超出的内存数据高大数组(MATLAB)。
使用注意事项和限制:
不支持绘图。金宝app
在名称 - 值对参数的名称必须是编译时间常数。
在下面的名称 - 值对的参数值也必须是编译时常:“BoundaryCorrection”
,'功能'
和'核心'
。例如,使用'功能', 'CDF'
在生成的代码名称 - 值对的参数,包括{coder.Constant( '功能'),coder.Constant( 'CDF')}
在里面-args
的价值codegen
。
的价值'核心'
名称 - 值对参数不能自定义函数句柄。要指定自定义内核函数,用一个特征向量或串标。
对于的价值'金宝app支持'
名称 - 值对参数,该编译时数据类型必须与运行时数据类型相匹配。
您单击对应于该MATLAB命令的链接:
在MATLAB命令窗口中输入它运行的命令。Web浏览器不支持MATLAB的命令。金宝app
您还可以选择从下面的列表中的网站:
选择最佳的网站性能的中国网站(在中国或英文)。其他MathWorks的国家网站都没有从您的位置访问进行了优化。