主要内容

ksdity.

单变量和双变量数据的内核平滑功能估算

描述

例子

f西) = ksdensity (x返回一个概率密度估计,f,用于向量或两列矩阵中的样本数据x.这个估计是基于一个正态核函数,并在等间距点处进行计算,西,它涵盖了数据的范围xksdity.估计为单变量数据的100分的密度,或者为二元数据的900分。

ksdity.适用于连续分布的样本。

例子

f西) = ksdensity (x指定点()来评估f.在这里,西包含相同的值。

例子

f西) = ksdensity (___名称,价值使用由一个或多个名称-值对参数指定的附加选项,以及前面语法中的任何输入参数。例如,可以定义函数类型ksdity.计算,如概率密度、累积概率、幸存者函数等。或者你可以指定平滑窗口的带宽。

例子

f西bw) = ksdensity (___也返回核平滑窗口的带宽,bw.默认带宽是正常密度的最优带宽。

例子

ksdensity (___绘制核平滑函数估计图。

ksdensity (斧头___用带有手柄的坐标轴绘制结果,斧头,而不是返回的当前轴gca

例子

全部收缩

生成从两个正态分布的混合物设置的样本数据。

rng (“默认”%的再现性1 x = [randn(30日);5 + randn(30日1)];

绘制估计的密度。

[f, xi] = ksdensity (x);图绘图(xi,f);

图中包含一个轴对象。轴对象包含类型线的对象。

密度估计显示了样品的双峰性。

从半正态分布生成非负样本数据集。

rng (“默认”%的再现性pd = makedist (“HalfNormal”“亩”0,“σ”,1);x =随机(PD,100,1);

用对数变换和反射两种不同的边界校正方法对pdf进行估计“BoundaryCorrection”名称-值对的论点。

分= linspace (0, 1000);对估计值进行评估[f1,ξ1]= ksdensity (x,分,“金宝app支持”“积极”);(f2,ξ2))= ksdensity (x,分,“金宝app支持”“积极”“BoundaryCorrection”'反射');

绘制两个估计pdf。

Plot (xi1,f1,xi2,f2) LGD = legend(“日志”'反射');标题(乐金显示器,“边界修正法”) xl = xlim;xlim ([-0.25 xl xl (1) (2)))

图中包含一个轴对象。轴对象包含两个类型为line的对象。这些对象表示日志、反射。

ksdity.当指定正支持或有界支持时,使用边界校正方法。金宝app默认的边界校正方法是对数变换。当ksdity.将支持转换回来,它引入金宝app1 / x核密度估计中的项。因此,估计值在附近有一个峰值x = 0.另一方面,反射方法不会导致边界附近的不期望的峰值。

加载样本数据。

负载医院

计算和绘图估计的cdf评估在一个指定的值集。

分= (min (hospital.Weight): 2:马克斯(hospital.Weight));图()ecdf (hospital.Weight)[f,xi,bw] = ksdenty(医院。重量,pts,“金宝app支持”“积极”...“函数”“提供”);情节(xi, f,“g”“线宽”2)传说(“经验提供”“kernel-bw:违约”“位置”“西北”)包含('病人的重量')ylabel('估计CDF'

图中包含一个轴对象。轴对象包含楼梯型、直线型2个对象。这些对象代表经验的cdf, kernel-bw:default。

ksdity.似乎平滑的累积分布函数估计太多了。具有较小带宽的估计可能产生更接近经验累积分布函数的估计。

返回平滑窗口的带宽。

bw
bw = 0.1070

绘制累积分布函数估计使用较小的带宽。

[f,xi] = ksdenty(医院。重量,pts,“金宝app支持”“积极”...“函数”“提供”“带宽”, 0.05);情节(xi, f,“——r”“线宽”2)传说(“经验提供”“kernel-bw:违约”“kernel-bw: 0.05”...“位置”“西北”) 抓住离开

图中包含一个轴对象。坐标轴对象包含楼梯型、直线型3个对象。这些对象代表经验cdf, kernel-bw:default, kernel-bw:0.05。

ksdity.较小带宽下的估计更符合经验累积分布函数。

加载样本数据。

负载医院

在50个等距点处绘制估计的cdf值。

图()ksdensity(医院。重量,“金宝app支持”“积极”“函数”“提供”...“NumPoints”,50)Xlabel('病人的重量')ylabel('估计CDF'

图中包含一个轴对象。轴对象包含类型线的对象。

从均值为3的指数分布中生成样本数据。

rng (“默认”%的再现性随机(x =“经验”, 3100, (1);

创建一个表示审查的逻辑向量。在这里,寿命超过10年的观测结果被删除。

T = 10;岑= (x > T);

计算并绘制估计的密度函数。

图ksdensity (x,“金宝app支持”“积极”“审查”岑);

图中包含一个轴对象。轴对象包含类型线的对象。

计算并绘制幸存者函数。

图ksdensity (x,“金宝app支持”“积极”“审查”岑,...“函数”“幸存者”);

图中包含一个轴对象。轴对象包含类型线的对象。

计算并绘制累积风险函数。

图ksdensity (x,“金宝app支持”“积极”“审查”岑,...“函数”“cumhazard”);

图中包含一个轴对象。轴对象包含类型线的对象。

生成两个正常分布的混合,并在指定的概率值集中绘制估计的逆累积分布函数。

rng (“默认”%的再现性1 x = [randn(30日);5 + randn(30日1)];π= linspace (0 . 01, 99);图ksdensity (x,π,“函数”“icdf”);

图中包含一个轴对象。轴对象包含类型线的对象。

产生两个正常分布的混合物。

rng (“默认”%的再现性1 x = [randn(30日);5 + randn(30日1)];

返回平滑窗口的带宽以进行概率密度估计。

(f, xi, bw) = ksdensity (x);bw
bw = 1.5141

默认带宽对于正常密度是最优的。

绘制估计的密度。

图绘图(xi,f);Xlabel(“十一”)ylabel(“f”) 抓住

图中包含一个轴对象。轴对象包含类型线的对象。

使用增加的带宽值绘制密度。

[f,xi] = ksdenty(x,“带宽”, 1.8);情节(xi, f,“——r”“线宽”,1.5)

图中包含一个轴对象。轴对象包含两个类型为line的对象。

更高的带宽进一步平滑密度估计,这可能掩盖了分布的一些特性。

现在,使用降低的带宽值绘制密度。

[f,xi] = ksdenty(x,“带宽”,0.8);情节(xi, f,'-.k'“线宽”传说,1.5)(“bw =违约”“bw = 1.8”“bw = 0.8”) 抓住离开

图中包含一个轴对象。轴对象包含3个类型为line的对象。这些对象表示bw = default, bw = 1.8, bw = 0.8。

带宽越小,密度估计的平滑度越小,这就夸大了样本的某些特性。

创建一个两列向量的点来评估密度。

Gridx1 = -0.25:.05:1.25;Gridx2 = 0:.1:15;[x1,x2] = meshgrid(gridx1,gridx2);x1 = x1(:);x2 = x2(:);xi = [x1 x2];

生成30×2的矩阵,其包含自二变量正常分布的混合物的随机数。

rng (“默认”%的再现性X = [0+ 0.5 *rand(20,1) 5+2.5*rand(20,1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];

绘制样本数据的估计密度。

图ksdenty(x,xi);

图中包含一个轴对象。axis对象包含一个类型为surface的对象。

输入参数

全部收缩

示例数据ksdity.返回f值,指定为列向量或两列矩阵。对单变量数据使用列向量,对双变量数据使用两列矩阵。

例子:[f,xi] = ksdentions(x)

数据类型:|

要计算的点f,指定为向量或两列矩阵。对于单变量数据,可以是行向量或列向量。返回输出的长度f等于输入的点数吗

例子:分= (0:1:25);ksdensity (x,分);

数据类型:|

图的坐标轴手柄ksdity.绘制到,指定为句柄。

例如,如果h是一个人的句柄,然后ksdity.可以绘制出如下图。

例子:ksdensity (h, x)

名称-值参数

指定可选的逗号分隔的对名称,价值参数。的名字参数名和价值是相应的价值。的名字必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“审查”,岑,“内核”、“三角形”,“NumPoints”,20岁的“函数”,“提供”指定ksdity.通过对覆盖数据范围的20个等间距点进行评估,使用三角核平滑函数,并考虑向量中的删失数据信息,估计CDF

核平滑窗的带宽,是内点个数的函数x,指定为逗号分隔的配对组成“带宽”和标量值。如果样本数据是二元的,带宽也可以是两个元素的矢量。默认是估计正常密度的最佳选择[1],但您可能希望选择更大或更小的值来平滑或多或少。

如果您指定“BoundaryCorrection”作为“日志”(默认)和“金宝app支持”作为“积极”或一个向量[l u]ksdity.通过使用日志转换将有界数据转换为无界数据。的价值“带宽”是以转换后的值为尺度的。

例子:“带宽”,0.8

数据类型:|

边界校正方法,指定为逗号分隔对组成“BoundaryCorrection”“日志”'反射'

价值 描述
“日志”

ksdity.转换的数据x不受下列转换之一的限制。然后,在密度估计后,将其转换回原始的有界尺度。

  • 对于单变量数据,如果指定“金宝app支持”,“积极”,然后ksdity.适用于log(x)

  • 对于单变量数据,如果指定“金宝app支持”,[L U],在那里lU数值标量和L < U,然后ksdity.适用于日志((xl) / (U-x))

  • 对于双变量数据,ksdity.变换的每一列x单变量数据也是如此。

的价值“带宽”bw输出位于转换值的比例。

'反射'

ksdity.通过在边界附近添加反射数据来增加有界数据,然后返回与原始支持相对应的估计。金宝app有关详细信息,请参见反射方法

ksdity.仅在指定时应用边界校正“金宝app支持”作为一种价值'无限制'

例子:“BoundaryCorrection”、“反射”

逻辑向量,指示哪些条目被删除,指定为逗号分隔对,由“审查”和一个二进制值向量。0表示不截尾,1表示观察被截尾。默认是没有审查。此名称-值对仅对单变量数据有效。

例子:“审查”,censdata

数据类型:逻辑

函数估计,指定为由逗号分隔的对组成“函数”下面是其中之一。

价值 描述
“pdf” 概率密度函数。
“提供” 累积分布函数。
“icdf”

逆累积分布函数。ksdity.计算值的估计的逆CDFx,并在指定的概率值下评估它π

此值仅对单变量数据有效。

“幸存者” 幸存者的功能。
“cumhazard”

累积风险函数。

此值仅对单变量数据有效。

例子:“函数”“icdf”

内核平滑器的类型,指定为逗号分隔对,由'核心'下面是其中之一。

  • “正常”(默认)

  • “盒子”

  • “三角形”

  • “epanechnikov”

  • 自定义或内置的内核函数。将函数指定为函数句柄(例如,@myfunction@normpdf)或作为字符向量或字符串标量(例如,“myfunction”“normpdf”).该软件使用一个参数调用指定的函数,该参数是数据值和计算密度的位置之间的距离数组。函数必须返回一个大小相同的数组,其中包含内核函数的相应值。

    “函数”“pdf”时,核函数返回密度值。否则,它将返回累积概率值。

    指定自定义内核“函数”“icdf”返回一个错误。

对于双变量数据,ksdity.将相同的内核应用于每个维度。

例子:'内核','box'

同样间隔点的数量西,指定为逗号分隔的配对组成“NumPoints”和标量值。此名称-值对仅对单变量数据有效。

例如,对于给定函数在样本数据范围内的80个等间距点处的核平滑估计,输入:

例子:“NumPoints”,80年

数据类型:|

金宝app支持密度,指定为逗号分隔对组成“金宝app支持”下面是其中之一。

价值 描述
'无限制' 违约。让密度延伸到整条实线。
“积极” 将密度限制为正值。
双元素向量,[l u] 给出密度支撑的有限上界和下界。金宝app此选项仅对单变量样本数据有效。
2乘2矩阵,(L1 L2;U1 U2) 给出密度支撑的有限上界和下界。金宝app第一行包含下限,第二行包含上限。此选项仅对双变量样本数据有效。

对于双变量数据,“金宝app支持”可以是正的、无界的或有界的变量的组合,指定为[0负无穷;正正)[0 l;inf U]

例子:“金宝app支持”,“积极”

例子:'金宝app支持',[0 10]

数据类型:||字符|字符串

函数,用于创建核密度图,指定为由逗号分隔的对组成'plotfcn'下面是其中之一。

价值 描述
“冲浪” 3-D阴影表面图,创建使用冲浪
'轮廓' 等高线图,创建使用轮廓
'plot3' 3-D线图,使用Plot3.
“surfc” 轮廓图在一个三维阴影表面图,创建使用冲浪器

此名称-值对仅对二元样本数据有效。

例子:“PlotFcn”、“轮廓”

样本数据的权重,指定为逗号分隔对“重量”和一个长度的向量大小(x, 1),在那里x为示例数据。

例子:“重量”,xw

数据类型:|

输出参数

全部收缩

函数的估计值,以向量的形式返回,向量的长度等于函数中点的个数西

评估点ksdity.计算f,返回为向量或两列矩阵。对于单变量数据,默认值是100个等间距点,覆盖中数据的范围x.对于二元数据,默认值是使用meshgrid.从每个维度的30个等间隔点。

平滑窗口的带宽,作为标量值返回。

如果您指定“BoundaryCorrection”作为“日志”(默认)和“金宝app支持”作为“积极”或一个向量[l u]ksdity.通过使用日志转换将有界数据转换为无界数据。的价值bw是以转换后的值为尺度的。

更多关于

全部收缩

内核分配

内核分布是随机变量的概率密度函数(PDF)的非参数表示。当参数分布无法正确描述数据时,或者希望避免对数据分发进行假设时,可以使用内核分发。内核分布由平滑功能和带宽值定义,该带宽值控制得到的密度曲线的平滑度。

核密度估计器是随机变量的估计pdf。对于任意实值x,给出核密度估计的公式

f h x 1 n h 1 n K x x h

在哪里x1x2,......,xn是来自未知分布的随机样本,n为样本量, K · 是内核平滑功能,和h是带宽。

的任意实值的累积分布函数(cdf)的核估计量x, 是(谁)给的

F h x x f h t d t 1 n 1 n G x x h

在哪里 G x x K t d t

有关详细信息,请参见内核分配

反射方法

反射法是在随机变量具有有界支持时精确地找到核密度估计量的一种边界修正方法。金宝app如果您指定“BoundaryCorrection”、“反射”ksdity.使用反射方法。该方法通过在边界附近添加反射数据来扩充边界数据,并对pdf进行估计。然后,ksdity.通过适当的标准化返回与原始支持对应的估计PDF,以便估计PDF对原始支持的积分等于1。金宝app

如果您另外指定“金宝app支持”,[L U],然后ksdity.求核估计量如下。

  • 如果“函数”“pdf”,然后内核密度估计器是

    f h x 1 n h 1 n K x x h + K x x h + K x x + h lxU

    在哪里 x 2 l x x + 2 U x , 和x样本数据。

  • 如果“函数”“提供”,CDF的内核估计值是

    F h x 1 n 1 n G x x h + G x x h + G x x + h 1 n 1 n G l x h + G l x h + G l x + h lxU

  • 求逆cdf、存活函数或累积危险函数的核估计量(当“函数”“icdf”“幸存者”,或“cumhazrd”),ksdity.用途 f h x F h x

如果您另外指定“金宝app支持”作为“积极”[0正],然后ksdity.通过替换求得核估计量[l u][0正]在上述方程中。

参考文献

鲍曼,A. W.和阿扎里尼。应用平滑技术进行数据分析.纽约:牛津大学新闻公司,1997年。

[2] Hill,P. D.“分布函数的核估计”。统计通讯-理论和方法.1985年第14卷第3期605-620页。

[3] Jones, M. C. <核密度估计的简单边界校正>。统计和计算.卷。3,第399号,第135-146页。

[4] Silverman,B. W.用于统计和数据分析的密度估计.查普曼和霍尔/CRC, 1986。

扩展功能

在R2006A之前介绍