ksdensity

核平滑函数估计单变量和双变量数据

全页折叠

句法

并[f，Ⅺ] = ksdensity（x）的

并[f，Ⅺ] = ksdensity（X，PTS）

并[f，Ⅺ] = ksdensity（___，名称，值）

并[f，XI，BW] = ksdensity（___）

ksdensity（___）

ksdensity (ax,___）

描述

例

[F，喜)= ksdensity (X）返回的概率密度估计，F，对于在载体或两列的矩阵的采样数据X。该估计是基于一个正常的核函数，并在等间距点进行计算，喜，覆盖了数据的范围X。ksdensity估计的100个点对单变量数据，或900点数据二元密度。

ksdensity在最佳状态下连续分布的样品。

例

[F，喜)= ksdensity (X，分）指定点（分)来评估F。这里，喜和分包含相同的值。

例

[F，喜)= ksdensity (___，名称，值）使用由一个或多个名-值对参数指定的附加选项，以补充前面语法中的任何输入参数。例如，您可以定义函数类型ksdensity求值，如概率密度，累积概率，幸存者的功能，等等。或者你也可以指定平滑窗口的带宽。

例

[F，喜，BW)= ksdensity (___）也返回核平滑窗口的带宽，BW。默认带宽是正常密度的优化。

例

ksdensity（___）绘制的核平滑函数估计。

ksdensity（斧头，___）利用轴与手柄地块的结果，斧头，而不是当前的轴返回由GCA。

例子

全部收缩

估计密度

开立真实脚本

生成从两个正态分布的混合物的样本数据集。

RNG（'默认'）％用于重现X = [randn（30,1）;5 + randn（30,1）];

画出估算的浓度。

[f, xi] = ksdensity (x);图情节（XI中，f）;

密度估计显示了样品的双峰性。

估计密度与边界校正

开立真实脚本

从半正态分布中生成非负样本数据集。

RNG（'默认'）％用于重现PD = makedist（'HalfNormal'，“亩”，0，“西格玛”，1）;X =随机（PD，100,1）;

概率密度函数与两个不同的边界校正方法，对数变换和反射估算，通过使用“BoundaryCorrection”名称 - 值对的参数。

PTS = linspace（0,5,1000）;％点来评估估计[F1，XI1] = ksdensity（X，PTS，'金宝app支持'，“积极”）;[F2，XI2] = ksdensity（X，PTS，'金宝app支持'，“积极”，“BoundaryCorrection”，'反射'）;

画出两个估计的PDF文件。

情节（XI1，F1，XI2，F2）LGD =图例（“日志”，'反射'）;标题（LGD，“边界校正方法”) xl = xlim;xlim ([-0.25 xl xl (1) (2)))

ksdensity在指定正支持或有界支持时使用边界校正方法。金宝app默认的边界修正方法是log变换。当ksdensity转换背部支撑，介绍了金宝app1 / x长期在内核密度估计。因此，估计有接近峰值x = 0的。在另一方面，反射方法不会导致的边界附近不希望的峰值。

在指定的值估计累积分布函数

开立真实脚本

加载样本数据。

加载医院

计算并绘制估计CDF在指定的一组值进行评价。

分= (min (hospital.Weight): 2:马克斯(hospital.Weight));图()ecdf (hospital.Weight)上并[f，XI，BW] = ksdensity（hospital.Weight，PTS，'金宝app支持'，“积极”，...'功能'，'CDF'）;图（十一，F，'-G'，'行宽'，2）图例（“经验CDF”，'内核-BW：默认'，“位置”，'西北'）xlabel（“患者体重”）ylabel（“估计CDF”）

ksdensity似乎顺利累积分布函数估计太多。具有较小带宽的估计可能会产生更紧密的估计与经验累积分布函数。

返回平滑窗口的带宽。

BW

BW = 0.1070

绘制使用较小的带宽累积分布函数估计。

并[f，Ⅺ] = ksdensity（hospital.Weight，PTS，'金宝app支持'，“积极”，...'功能'，'CDF'，'带宽',0.05);图（十一，F，“——r”，'行宽'，2）图例（“经验CDF”，'内核-BW：默认'，“kernel-bw: 0.05”，...“位置”，'西北'）保持离

该ksdensity估计与较小的带宽经验累积分布函数更好匹配。

剧情估计累积密度函数点的给定数量

开立真实脚本

加载样本数据。

加载医院

绘制所估计的CDF在50点等距间隔的点进行评价。

图()ksdensity (hospital.Weight,'金宝app支持'，“积极”，'功能'，'CDF'，...“NumPoints”，50）xlabel（“患者体重”）ylabel（“估计CDF”）

估计幸存者和删失数据累积风险

开立真实脚本

从均值为3的指数分布中生成样本数据。

RNG（'默认'）％用于重现随机(x ='EXP',3100,(1);

创建一个表示审查的逻辑向量。在这里，寿命超过10年的观测结果被审查。

T = 10;经社=（X> T）;

计算并绘制估计的密度函数。

图ksdensity (x,'金宝app支持'，“积极”，“截尾”岑);

计算并绘制幸存者功能。

图ksdensity (x,'金宝app支持'，“积极”，“截尾”岑,...'功能'，'幸存者'）;

计算并绘制累积危险函数。

图ksdensity (x,'金宝app支持'，“积极”，“截尾”岑,...'功能'，'cumhazard'）;

对于指定的概率值估计逆累积分布函数

开立真实脚本

生成两个正态分布的混合物，并绘制在指定的一组概率值的所估计的逆累积分布函数。

RNG（'默认'）％用于重现X = [randn（30,1）;5 + randn（30,1）];PI = linspace（0.01，.99,99）;图ksdensity（X，P1，'功能'，'ICDF'）;

平滑窗口的反向带宽

开立真实脚本

生成两个正态分布的混合物。

RNG（'默认'）％用于重现X = [randn（30,1）;5 + randn（30,1）];

返回平滑窗口的带宽的概率密度估计。

并[f，XI，BW] = ksdensity（X）;BW

BW = 1.5141

默认带宽是最佳的正常密度。

画出估算的浓度。

图情节（XI中，f）;xlabel（“十一”）ylabel（'F'）保持上

使用增加的带宽值绘制密度。

并[f，Ⅺ] = ksdensity（X，'带宽'，1.8）;图（十一，F，“——r”，'行宽'1.5）

更高的带宽进一步平滑了密度估计，这可能掩盖了分布的一些特性。

现在，绘制使用减少的带宽值的密度。

并[f，Ⅺ] = ksdensity（X，'带宽'，0.8）;图（十一，F，'-.k'，'行宽'传说,1.5)(“bw =违约”，'BW = 1.8'，'BW = 0.8'）保持离

较小的带宽平滑的密度估计值更小，这夸大了样品的一些特性。

二元数据的叠加核密度估计

开立真实脚本

创建在该评估密度点的一个两列向量。

gridx1 = -0.25：0.05：1.25;gridx2 = 0：0.1：15;[X1，X2] = meshgrid（gridx1，gridx2）;X1 = X1（:);X2 = X2（:);XI = [X1 X2];

产生从二元正态分布的混合物包含随机数的30×2矩阵。

RNG（'默认'）％用于重现x = [0+ 5*rand(20,1) 5+2.5*rand(20,1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];

绘制样本数据的估计密度。

图ksdensity（X，XI）;

输入参数

全部收缩

`X`-样本数据
列向量|两列的矩阵

对于其中的样本数据ksdensity回报F值，指定为列向量或两列的矩阵。使用单变量数据的列向量，以及用于二元数据的两列的矩阵。

例：并[f，Ⅺ] = ksdensity（x）的

数据类型：单|双

`分`-点，其评估`F`
向量|两列的矩阵

点，其评估F，指定为矢量或两列的矩阵。对于单变量数据，分可以是行或列向量。返回的输出的长度F等于点的数目分。

例：PTS =（0：1：25）;ksdensity（X，PTS）;

数据类型：单|双

`斧头`-轴处理
处理

图形的轴句柄ksdensity阴谋，指定为把手。

例如，如果H是一个数字的句柄，然后ksdensity可以绘制出如下图。

例：ksdensity（H，X）

名称 - 值对参数

指定可选的用逗号分隔的对名称，值参数。的名字是参数的名称和值是对应的值。的名字必须出现引号内。您可以按照任何顺序指定多个名称和值对参数名1，值1，...，NameN，值N。

例：'截尾'，经社， '核心'， '三角形'， '为NumPoints'，20， '功能'， 'CDF'该指定ksdensity利用三角形核平滑函数，并考虑矢量中的截尾数据信息，对覆盖数据范围的20个等间距点进行评价，从而估计cdfCENS。

`'带宽'`-内核平滑窗口的带宽
正常密度最优值(默认)|标量值|二元素矢量

内核平滑窗口的带宽，这是一个点的在数目的函数X，指定为逗号分隔的一对组成的'带宽'和一个标量值。如果样本数据是双变量的，带宽也可以是一个两元素矢量。默认值是最佳估计正常密度[1]，但你可能想选择一个或大或小的值，以平滑更多或更少。

如果您指定“BoundaryCorrection”如“日志”（默认）和'金宝app支持'因为无论是“积极”或载体[L C]，ksdensity使用日志转换将有界数据转换为无界数据。的价值'带宽'是在变换值的比例。

例：“带宽”,0.8

数据类型：单|双

`“BoundaryCorrection”`-边界修正法
“日志”(默认)|'反射'

边界校正方法，指定为逗号分隔的一对组成的“BoundaryCorrection”和“日志”要么'反射'。

值描述

值	描述
`“日志”`	`ksdensity`转换界数据`X`不受下列变换之一的限制。然后，经过密度估计，将其转换回原始的有界尺度。对于单变量数据，如果您指定`“金宝app支持”,“积极”`，然后`ksdensity`适用`日志（X）`。对于单变量数据，如果您指定`'金宝app支持'，[L C]`，其中`大号`和`ü`是数字标量和`→<ù`，然后`ksdensity`适用`日志（（X-L）/（U-X））`。对于双变量数据，`ksdensity`转换的每一列`X`与单变量数据以同样的方式。的价值`'带宽'`和`BW`输出是经变换的值的标度。
`'反射'`	`ksdensity`增强件通过将边界附近的反射数据有界的数据，那么它返回对应于原始支承估计。金宝app有关详细信息，请参阅反射法。

“日志”

ksdensity转换界数据X不受下列变换之一的限制。然后，经过密度估计，将其转换回原始的有界尺度。

对于单变量数据，如果您指定“金宝app支持”,“积极”，然后ksdensity适用日志（X）。
对于单变量数据，如果您指定'金宝app支持'，[L C]，其中大号和ü是数字标量和→<ù，然后ksdensity适用日志（（X-L）/（U-X））。
对于双变量数据，ksdensity转换的每一列X与单变量数据以同样的方式。

的价值'带宽'和BW输出是经变换的值的标度。

'反射'

ksdensity增强件通过将边界附近的反射数据有界的数据，那么它返回对应于原始支承估计。金宝app有关详细信息，请参阅反射法。

ksdensity仅当您指定时应用边界校正'金宝app支持'作为以外的值“无界”。

例：“BoundaryCorrection”、“反射”

`“截尾”`-逻辑向量
0的矢量(默认)|0和1的矢量

指示哪个条目被审查，指定为逗号分隔的一对组成的逻辑矢量“截尾”和一个二进制值的向量。0表示没有截尾，1表示观察被截尾。默认是没有审查。此名称 - 值对只适用于单变量的数据。

例：'截尾'，censdata

数据类型：合乎逻辑

`'功能'`-函数来估计
`'PDF'`(默认)|`'CDF'`|`'ICDF'`|`'幸存者'`|`'cumhazard'`

函数要估计，指定为由逗号分隔的对组成'功能'与下列情况之一。

值	描述
`'PDF'`	概率密度函数。
`'CDF'`	累积分布函数。
`'ICDF'`	逆累积分布函数。`ksdensity`计算中的值的估计的逆CDF`X`，且评估其在指定的概率值`π`。此值仅适用于单变量数据是有效的。
`'幸存者'`	存活函数。
`'cumhazard'`	累积风险的功能。此值仅适用于单变量数据是有效的。

例：'功能'，'ICDF'

`'核心'`-核光滑器的类型
`'正常'`(默认)|`“盒子”`|`'三角形'`|`'epanechnikov'`|功能手柄|特征向量|字符串标量

类型的内核平滑的，指定为逗号分隔的一对组成的'核心'与下列情况之一。

'正常'（默认）
“盒子”
'三角形'
'epanechnikov'
内核函数是一个自定义或内置功能。指定的函数作为函数手柄（例如，@myfunction要么@normpdf），或者作为一个字符向量或标量的字符串（例如，'MyFunction的'要么'normpdf')。该软件使用一个参数调用指定的函数，该参数是数据值与计算密度的位置之间的距离数组。函数必须返回包含内核函数相应值的相同大小的数组。
当'功能'是'PDF'，内核函数返回密度值。否则，它返回累积概率值。
指定自定义内核时'功能'是'ICDF'返回一个错误。

对于双变量数据，ksdensity应用相同的内核每个维度。

例：“核心”，“盒子”

`“NumPoints”`-的等距点数
One hundred.(默认)|标量值

在等距点数喜，指定为逗号分隔的一对组成的“NumPoints”和一个标量值。此名称 - 值对只适用于单变量的数据。

例如，对于一个内核在采样数据，输入的范围内的80个间隔的点平滑指定功能的估计：

例：'为NumPoints'，80

数据类型：单|双

`'金宝app支持'`-金宝app支持密度
`“无界”`(默认)|`“积极”`|两个元素的向量，`[L C]`|2乘2矩阵,`[L1 L2;U1 U2]`

金宝app支持密度，指定为逗号分隔的一对组成的'金宝app支持'与下列情况之一。

值	描述
`“无界”`	默认。允许密度，延长了整个实线。
`“积极”`	限制密度为正值。
双元素向量,`[L C]`	给出了支持密度的有限下界和上界。金宝app此选项仅适用于单变量的样本数据。
二对二矩阵，`[L1 L2;U1 U2]`	给出了支持密度的有限下界和上界。金宝app第一行包含下限，第二行包含上限。此选项仅对双变量样本数据有效。

对于双变量数据，'金宝app支持'可以指定为正，无界的，或有界变量的组合[0 -Inf;天道酬勤天道酬勤]要么[0 L，天道酬勤ù]。

例：“金宝app支持”,“积极”

例：'金宝app支持'，[0 10]

数据类型：单|双|烧焦|字符串

`'PlotFcn'`-函数用于创建内核密度图
`“冲浪”`(默认)|`'轮廓'`|`'plot3'`|`'surfc'`

函数用于创建内核密度图，指定由逗号分隔的对组成'PlotFcn'与下列情况之一。

值	描述
`“冲浪”`	3-d阴影面积，使用创建的`冲浪`
`'轮廓'`	等高线图，用创建`轮廓`
`'plot3'`	3-d线图，使用创建的`plot3`
`'surfc'`	下一个3-d等高线图的阴影面积，使用创建的`surfc`

这个名称 - 值对是仅适用于二元样本数据。

例：'PlotFcn'， '轮廓'

`“权重”`-权重样本数据
向量

权重的样本数据，指定为逗号分隔的一对组成的“权重”和长度的矢量大小(x, 1)，其中X是样品的数据。

例：'权重'，XW

数据类型：单|双

输出参数

全部收缩

`F`- 估计函数值
向量

函数值的估计值，以向量的形式返回，其长度等于其中的点的个数喜要么分。

`喜`- 评估点
100个间隔的点|900个等距点|矢量|两列的矩阵

评估点ksdensity计算F时，返回作为载体或两列的矩阵。对于单变量数据，默认为覆盖数据的范围为100等间距点X。对于二元数据，默认值是900等间距点使用创建的meshgrid从在每个维度30等距点。

`BW`- 平滑窗口的带宽
标量值

平滑窗口的带宽，作为标量值返回。

如果您指定“BoundaryCorrection”如“日志”（默认）和'金宝app支持'因为无论是“积极”或载体[L C]，ksdensity使用日志转换将有界数据转换为无界数据。的价值BW是在变换值的比例。

参考

[1]鲍曼，A. W.，和A. Azzalini。应用平滑技术进行数据分析。纽约：牛津大学出版公司，1997。

[2]山，P.D。“分布函数的核估计”。理论与方法 - 统计通讯。第14卷，第。3，1985年，第605-620。

[3]琼斯，M. C.“核密度估计的简单边界校正”。统计与计算。卷。3，第3期，1993，第135-146。

[4]西尔弗曼，B.W。密度估计统计和数据分析。查普曼和霍尔/ CRC，1986。

扩展功能

高大的数组
与具有较适合在内存中更多的行阵列计算。

此功能支持用于与一些限制内存金宝app不足数据高大阵列。

不支持一些需要额外传递或对输入数据进行排序的选项:金宝app
- “BoundaryCorrection”
- “截尾”
- '金宝app支持'（金宝app支持无限总是）。
使用标准偏差(而不是中位数绝对偏差)来计算带宽。

欲了解更多信息，请参阅对于超出的内存数据高大数组（MATLAB）。

C / C ++代码生成
生成使用MATLAB®编码器™C和C ++代码。

使用注意事项和限制：

不支持绘图。金宝app
在名称 - 值对参数的名称必须是编译时间常数。
在下面的名称 - 值对的参数值也必须是编译时常：“BoundaryCorrection”，'功能'和'核心'。例如，使用'功能'， 'CDF'在生成的代码名称 - 值对的参数，包括{coder.Constant（ '功能'），coder.Constant（ 'CDF'）}在里面-args的价值codegen。
的价值'核心'名称 - 值对参数不能自定义函数句柄。要指定自定义内核函数，用一个特征向量或串标。
对于的价值'金宝app支持'名称 - 值对参数，该编译时数据类型必须与运行时数据类型相匹配。

有关代码生成的更多信息，请参阅代码生成简介和通用代码生成流程。

也可以看看

直方图|mvksdensity

ksdensity

句法

描述

例子

估计密度

估计密度与边界校正

在指定的值估计累积分布函数

剧情估计累积密度函数点的给定数量

估计幸存者和删失数据累积风险

对于指定的概率值估计逆累积分布函数

平滑窗口的反向带宽

二元数据的叠加核密度估计

输入参数

X-样本数据列向量|两列的矩阵

分-点，其评估F向量|两列的矩阵

斧头-轴处理处理

名称 - 值对参数

'带宽'-内核平滑窗口的带宽正常密度最优值(默认)|标量值|二元素矢量

“BoundaryCorrection”-边界修正法“日志”(默认)|'反射'

“截尾”-逻辑向量0的矢量(默认)|0和1的矢量

'功能'-函数来估计'PDF'(默认)|'CDF'|'ICDF'|'幸存者'|'cumhazard'

'核心'-核光滑器的类型'正常'(默认)|“盒子”|'三角形'|'epanechnikov'|功能手柄|特征向量|字符串标量

“NumPoints”-的等距点数One hundred.(默认)|标量值

'金宝app支持'-金宝app支持密度“无界”(默认)|“积极”|两个元素的向量，[L C]|2乘2矩阵,[L1 L2;U1 U2]

'PlotFcn'-函数用于创建内核密度图“冲浪”(默认)|'轮廓'|'plot3'|'surfc'

“权重”-权重样本数据向量

输出参数

F- 估计函数值向量

喜- 评估点100个间隔的点|900个等距点|矢量|两列的矩阵

BW- 平滑窗口的带宽标量值

更多关于

内核分配

反射法

参考

扩展功能

高大的数组与具有较适合在内存中更多的行阵列计算。

C / C ++代码生成生成使用MATLAB®编码器™C和C ++代码。

也可以看看

话题

R2006a前推出

统计和机器学习工具箱文档

金宝app

掌握机器学习：有步骤，分步指南与MATLAB

`X`-样本数据
列向量|两列的矩阵

`分`-点，其评估`F`
向量|两列的矩阵

`斧头`-轴处理
处理

`'带宽'`-内核平滑窗口的带宽
正常密度最优值(默认)|标量值|二元素矢量

`“BoundaryCorrection”`-边界修正法
“日志”(默认)|'反射'

`“截尾”`-逻辑向量
0的矢量(默认)|0和1的矢量

`'功能'`-函数来估计
`'PDF'`(默认)|`'CDF'`|`'ICDF'`|`'幸存者'`|`'cumhazard'`

`'核心'`-核光滑器的类型
`'正常'`(默认)|`“盒子”`|`'三角形'`|`'epanechnikov'`|功能手柄|特征向量|字符串标量

`“NumPoints”`-的等距点数
One hundred.(默认)|标量值

`'金宝app支持'`-金宝app支持密度
`“无界”`(默认)|`“积极”`|两个元素的向量，`[L C]`|2乘2矩阵,`[L1 L2;U1 U2]`

`'PlotFcn'`-函数用于创建内核密度图
`“冲浪”`(默认)|`'轮廓'`|`'plot3'`|`'surfc'`

`“权重”`-权重样本数据
向量

`F`- 估计函数值
向量

`喜`- 评估点
100个间隔的点|900个等距点|矢量|两列的矩阵

`BW`- 平滑窗口的带宽
标量值

高大的数组
与具有较适合在内存中更多的行阵列计算。

C / C ++代码生成
生成使用MATLAB®编码器™C和C ++代码。