单变量和双变量数据的内核平滑功能估算
生成从两个正态分布的混合物设置的样本数据。
rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];
绘制估计的密度。
[f, xi] = ksdensity (x);图绘图(xi,f);
密度估计显示了样品的双峰性。
从半正态分布生成非负样本数据集。
rng (“默认”)%的再现性pd = makedist (“HalfNormal”,“亩”0,“σ”,1);x =随机(PD,100,1);
用对数变换和反射两种不同的边界校正方法对pdf进行估计“BoundaryCorrection”
名称-值对的论点。
分= linspace (0, 1000);对估计值进行评估[f1,ξ1]= ksdensity (x,分,“金宝app支持”,“积极”);(f2,ξ2))= ksdensity (x,分,“金宝app支持”,“积极”,“BoundaryCorrection”,'反射');
绘制两个估计pdf。
Plot (xi1,f1,xi2,f2) LGD = legend(“日志”,'反射');标题(乐金显示器,“边界修正法”) xl = xlim;xlim ([-0.25 xl xl (1) (2)))
ksdity.
当指定正支持或有界支持时,使用边界校正方法。金宝app默认的边界校正方法是对数变换。当ksdity.
将支持转换回来,它引入金宝app1 / x
核密度估计中的项。因此,估计值在附近有一个峰值x = 0
.另一方面,反射方法不会导致边界附近的不期望的峰值。
加载样本数据。
负载医院
计算和绘图估计的cdf评估在一个指定的值集。
分= (min (hospital.Weight): 2:马克斯(hospital.Weight));图()ecdf (hospital.Weight)在[f,xi,bw] = ksdenty(医院。重量,pts,“金宝app支持”,“积极”,...“函数”,“提供”);情节(xi, f,“g”,“线宽”2)传说(“经验提供”,“kernel-bw:违约”,“位置”,“西北”)包含('病人的重量')ylabel('估计CDF')
ksdity.
似乎平滑的累积分布函数估计太多了。具有较小带宽的估计可能产生更接近经验累积分布函数的估计。
返回平滑窗口的带宽。
bw
bw = 0.1070
绘制累积分布函数估计使用较小的带宽。
[f,xi] = ksdenty(医院。重量,pts,“金宝app支持”,“积极”,...“函数”,“提供”,“带宽”, 0.05);情节(xi, f,“——r”,“线宽”2)传说(“经验提供”,“kernel-bw:违约”,“kernel-bw: 0.05”,...“位置”,“西北”) 抓住离开
的ksdity.
较小带宽下的估计更符合经验累积分布函数。
加载样本数据。
负载医院
在50个等距点处绘制估计的cdf值。
图()ksdensity(医院。重量,“金宝app支持”,“积极”,“函数”,“提供”,...“NumPoints”,50)Xlabel('病人的重量')ylabel('估计CDF')
从均值为3的指数分布中生成样本数据。
rng (“默认”)%的再现性随机(x =“经验”, 3100, (1);
创建一个表示审查的逻辑向量。在这里,寿命超过10年的观测结果被删除。
T = 10;岑= (x > T);
计算并绘制估计的密度函数。
图ksdensity (x,“金宝app支持”,“积极”,“审查”岑);
计算并绘制幸存者函数。
图ksdensity (x,“金宝app支持”,“积极”,“审查”岑,...“函数”,“幸存者”);
计算并绘制累积风险函数。
图ksdensity (x,“金宝app支持”,“积极”,“审查”岑,...“函数”,“cumhazard”);
生成两个正常分布的混合,并在指定的概率值集中绘制估计的逆累积分布函数。
rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];π= linspace (0 . 01, 99);图ksdensity (x,π,“函数”,“icdf”);
产生两个正常分布的混合物。
rng (“默认”)%的再现性1 x = [randn(30日);5 + randn(30日1)];
返回平滑窗口的带宽以进行概率密度估计。
(f, xi, bw) = ksdensity (x);bw
bw = 1.5141
默认带宽对于正常密度是最优的。
绘制估计的密度。
图绘图(xi,f);Xlabel(“十一”)ylabel(“f”) 抓住在
使用增加的带宽值绘制密度。
[f,xi] = ksdenty(x,“带宽”, 1.8);情节(xi, f,“——r”,“线宽”,1.5)
更高的带宽进一步平滑密度估计,这可能掩盖了分布的一些特性。
现在,使用降低的带宽值绘制密度。
[f,xi] = ksdenty(x,“带宽”,0.8);情节(xi, f,'-.k',“线宽”传说,1.5)(“bw =违约”,“bw = 1.8”,“bw = 0.8”) 抓住离开
带宽越小,密度估计的平滑度越小,这就夸大了样本的某些特性。
创建一个两列向量的点来评估密度。
Gridx1 = -0.25:.05:1.25;Gridx2 = 0:.1:15;[x1,x2] = meshgrid(gridx1,gridx2);x1 = x1(:);x2 = x2(:);xi = [x1 x2];
生成30×2的矩阵,其包含自二变量正常分布的混合物的随机数。
rng (“默认”)%的再现性X = [0+ 0.5 *rand(20,1) 5+2.5*rand(20,1);综合成绩+ .25 *兰德(10,1)8.75 + 1.25 *兰德(10,1)];
绘制样本数据的估计密度。
图ksdenty(x,xi);
x
- - - - - -样本数据分
- - - - - -要计算的点f
斧头
- - - - - -轴处理图的坐标轴手柄ksdity.
绘制到,指定为句柄。
例如,如果h
是一个人的句柄,然后ksdity.
可以绘制出如下图。
例子:ksdensity (h, x)
指定可选的逗号分隔的对名称,价值
参数。的名字
参数名和价值
是相应的价值。的名字
必须出现在引号内。您可以以任何顺序指定多个名称和值对参数Name1, Value1,…,的家
.
“审查”,岑,“内核”、“三角形”,“NumPoints”,20岁的“函数”,“提供”
指定ksdity.
通过对覆盖数据范围的20个等间距点进行评估,使用三角核平滑函数,并考虑向量中的删失数据信息,估计CDF克
.
带宽
- - - - - -核平滑窗口的带宽核平滑窗的带宽,是内点个数的函数x
,指定为逗号分隔的配对组成“带宽”
和标量值。如果样本数据是二元的,带宽
也可以是两个元素的矢量。默认是估计正常密度的最佳选择[1],但您可能希望选择更大或更小的值来平滑或多或少。
如果您指定“BoundaryCorrection”
作为“日志”
(默认)和“金宝app支持”
作为“积极”
或一个向量[l u]
,ksdity.
通过使用日志转换将有界数据转换为无界数据。的价值“带宽”
是以转换后的值为尺度的。
例子:“带宽”,0.8
数据类型:单
|双
边界粗校
- - - - - -边界修正法边界校正方法,指定为逗号分隔对组成“BoundaryCorrection”
和“日志”
或'反射'
.
价值 | 描述 |
---|---|
“日志” |
|
'反射' |
|
ksdity.
仅在指定时应用边界校正“金宝app支持”
作为一种价值'无限制'
.
例子:“BoundaryCorrection”、“反射”
审查
- - - - - -逻辑矢量逻辑向量,指示哪些条目被删除,指定为逗号分隔对,由“审查”
和一个二进制值向量。0表示不截尾,1表示观察被截尾。默认是没有审查。此名称-值对仅对单变量数据有效。
例子:“审查”,censdata
数据类型:逻辑
功能
- - - - - -函数来估计“pdf”
(默认)|“提供”
|“icdf”
|“幸存者”
|“cumhazard”
函数估计,指定为由逗号分隔的对组成“函数”
下面是其中之一。
价值 | 描述 |
---|---|
“pdf” |
概率密度函数。 |
“提供” |
累积分布函数。 |
“icdf” |
逆累积分布函数。 此值仅对单变量数据有效。 |
“幸存者” |
幸存者的功能。 |
“cumhazard” |
累积风险函数。 此值仅对单变量数据有效。 |
例子:“函数”
,“icdf”
核心
- - - - - -核平滑器类型“正常”
(默认)|“盒子”
|“三角形”
|“epanechnikov”
|函数处理|特征向量|字符串标量内核平滑器的类型,指定为逗号分隔对,由'核心'
下面是其中之一。
“正常”
(默认)
“盒子”
“三角形”
“epanechnikov”
自定义或内置的内核函数。将函数指定为函数句柄(例如,@myfunction
或@normpdf
)或作为字符向量或字符串标量(例如,“myfunction”
或“normpdf”
).该软件使用一个参数调用指定的函数,该参数是数据值和计算密度的位置之间的距离数组。函数必须返回一个大小相同的数组,其中包含内核函数的相应值。
当“函数”
是“pdf”
时,核函数返回密度值。否则,它将返回累积概率值。
指定自定义内核“函数”
是“icdf”
返回一个错误。
对于双变量数据,ksdity.
将相同的内核应用于每个维度。
例子:'内核','box'
NumPoints
- - - - - -同等间隔的数量同样间隔点的数量西
,指定为逗号分隔的配对组成“NumPoints”
和标量值。此名称-值对仅对单变量数据有效。
例如,对于给定函数在样本数据范围内的80个等间距点处的核平滑估计,输入:
例子:“NumPoints”,80年
数据类型:单
|双
金宝app
- - - - - -金宝app密度支持'无限制'
(默认)|“积极”
|双元素向量,[l u]
|2乘2矩阵,(L1 L2;U1 U2)
金宝app支持密度,指定为逗号分隔对组成“金宝app支持”
下面是其中之一。
价值 | 描述 |
---|---|
'无限制' |
违约。让密度延伸到整条实线。 |
“积极” |
将密度限制为正值。 |
双元素向量,[l u] |
给出密度支撑的有限上界和下界。金宝app此选项仅对单变量样本数据有效。 |
2乘2矩阵,(L1 L2;U1 U2) |
给出密度支撑的有限上界和下界。金宝app第一行包含下限,第二行包含上限。此选项仅对双变量样本数据有效。 |
对于双变量数据,“金宝app支持”
可以是正的、无界的或有界的变量的组合,指定为[0负无穷;正正)
或[0 l;inf U]
.
例子:“金宝app支持”,“积极”
例子:'金宝app支持',[0 10]
数据类型:单
|双
|字符
|字符串
权重
- - - - - -样本数据的重量bw
- 平滑窗口的带宽平滑窗口的带宽,作为标量值返回。
如果您指定“BoundaryCorrection”
作为“日志”
(默认)和“金宝app支持”
作为“积极”
或一个向量[l u]
,ksdity.
通过使用日志转换将有界数据转换为无界数据。的价值bw
是以转换后的值为尺度的。
内核分布是随机变量的概率密度函数(PDF)的非参数表示。当参数分布无法正确描述数据时,或者希望避免对数据分发进行假设时,可以使用内核分发。内核分布由平滑功能和带宽值定义,该带宽值控制得到的密度曲线的平滑度。
核密度估计器是随机变量的估计pdf。对于任意实值x,给出核密度估计的公式
在哪里x1,x2,......,xn是来自未知分布的随机样本,n为样本量, 是内核平滑功能,和h是带宽。
的任意实值的累积分布函数(cdf)的核估计量x, 是(谁)给的
在哪里 .
有关详细信息,请参见内核分配.
反射法是在随机变量具有有界支持时精确地找到核密度估计量的一种边界修正方法。金宝app如果您指定“BoundaryCorrection”、“反射”
,ksdity.
使用反射方法。该方法通过在边界附近添加反射数据来扩充边界数据,并对pdf进行估计。然后,ksdity.
通过适当的标准化返回与原始支持对应的估计PDF,以便估计PDF对原始支持的积分等于1。金宝app
如果您另外指定“金宝app支持”,[L U]
,然后ksdity.
求核估计量如下。
如果“函数”
是“pdf”
,然后内核密度估计器是
为l≤x≤U,
在哪里
,
, 和x我是我
样本数据。
如果“函数”
是“提供”
,CDF的内核估计值是
为l≤x≤U.
求逆cdf、存活函数或累积危险函数的核估计量(当“函数”
是“icdf”
,“幸存者”
,或“cumhazrd”
),ksdity.
用途
和
.
如果您另外指定“金宝app支持”
作为“积极”
或[0正]
,然后ksdity.
通过替换求得核估计量[l u]
和[0正]
在上述方程中。
鲍曼,A. W.和阿扎里尼。应用平滑技术进行数据分析.纽约:牛津大学新闻公司,1997年。
[2] Hill,P. D.“分布函数的核估计”。统计通讯-理论和方法.1985年第14卷第3期605-620页。
[3] Jones, M. C. <核密度估计的简单边界校正>。统计和计算.卷。3,第399号,第135-146页。
[4] Silverman,B. W.用于统计和数据分析的密度估计.查普曼和霍尔/CRC, 1986。
对于内存不足的数据,这个函数金宝app支持高数组,但有一些限制。
不支持一些需要额外传递或对输入数据进行排序的选项:金宝app
“BoundaryCorrection”
“审查”
“金宝app支持”
(金宝app支持总是无界的)。
使用标准偏差(而不是中值绝对偏差)来计算带宽。
有关更多信息,请参见用于内存不足数据的高数组.
使用注意事项及限制:
不支持策划。金宝app
名称-值对参数中的名称必须是编译时常量。
以下名称-值对参数中的值也必须是编译时常量:“BoundaryCorrection”
,“函数”
, 和'核心'
.例如,使用“函数”、“提供”
生成的代码中的名称值对参数包括{coder.Constant(函数),coder.Constant (cdf)}
在arg游戏
的价值codegen
.
价值'核心'
名称-值对参数不能是自定义函数句柄。要指定自定义内核函数,请使用字符向量或字符串标量。
的值“金宝app支持”
名称-值对参数时,编译时数据类型必须与运行时数据类型匹配。
该功能完全支持GPU阵列。金宝app有关更多信息,请参见在GPU上运行MATLAB函数(并行计算工具箱).
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
您还可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。