主要内容

ecdf

经验累积分布函数

描述

例子

(f,x)= ecdf (y)返回经验累积分布函数f,评估x,使用的数据y

例子

(f,x)= ecdf (y,名称,值)使用一个或多个名称参数指定附加选项。例如,“函数”“幸存者”指定的类型的函数f作为一个幸存者的功能。

例子

(f,x,弗洛,管理方)= ecdf (___)也回报评估函数的上下置信界限值,使用任何输入参数组合在前面的语法。这个语法为结局数据是无效的。

例子

ecdf (___)产生一个梯级的图的评价函数。可视化的函数间隔使用阴影矩形结局估计数据。您可以指定“界限””,在“包括信心界限图的完全观察到,left-censored right-censored, double-censored数据。

ecdf (斧头,___)情节在指定的轴斧头而不是当前轴(gca)。

例子

全部折叠

计算kaplan meier经验累积分布函数的估计(cdf)对模拟的生存数据。

生成生存数据与参数威布尔分布3和1。

rng (“默认”)%的再现性failuretime =随机(“wbl”1、3、1、15日);

计算经验的kaplan meier估计为生存提供数据。

(f (x) = ecdf (failuretime);(f (x)
ans =16×20 0.0895 0.0667 0.0895 0.1333 0.1072 0.2000 0.1303 0.2667 0.1313 0.3333 0.2718 0.4000 0.2968 0.4667 0.6147 0.5333 0.6684 0.6000 1.3749⋮

情节估计经验提供。

ecdf (failuretime)

图包含一个坐标轴对象。坐标轴对象包含x, ylabel F (x)包含一个楼梯类型的对象。

生成right-censored生存数据和比较经验累积分布函数(cdf)提供。

生成失败时间的指数分布的平均故障时间15。

rng (“默认”)%的再现性y = exprnd (75,1);

产生退学次指数分布与平均故障时间的30。

d = exprnd (75,1);

生成故障时间,最小生成的故障时间和退出时间。

t = min (y, d);

创建一个逻辑数组包含生成失败时间大于退出时间。这种情况下的数据是真实的审查。

审查= (y > d);

计算经验cdf和信心。

[f, x,弗洛,管理方]= ecdf (t)“审查”、审查);

情节实证cdf和信心。

ecdf (t)“审查”审查,“界限”,“上”)举行

图包含一个坐标轴对象。坐标轴对象包含x, ylabel F (x)包含3个楼梯类型的对象。

重叠的一块已知的人口提供。

xx = 0。1:马克斯(t);yy = 1-exp (- xx / 15);情节(xx, yy,“g -”,“线宽”2)轴(max (t)[0 0 1])传说(“经验提供”,“低信心绑定”,“上信心绑定”,“已知的人口提供”,“位置”,“东南”)举行

图包含一个坐标轴对象。坐标轴对象包含x, ylabel F (x)包含4楼梯,类型的对象。这些对象代表经验运作,降低信心绑定,绑定上信心,已知的人口提供。

生成的生存数据和绘制经验幸存者函数99%置信界限。

生成寿命数据从100年的威布尔分布参数和2。

rng (“默认”)%的再现性R = wblrnd (100、2100、1);

情节的经验幸存者函数数据和99%置信界限。

ecdf (R,“函数”,“幸存者”,“α”,0.01,“界限”,“上”)举行

图包含一个坐标轴对象。坐标轴对象包含x, ylabel S (x)包含3对象类型的楼梯。

重叠的情节幸存者威布尔函数。

x = 1:1:250;wblsurv = 1-cdf (“威布尔”,100岁的x 2);情节(x, wblsurv,“g -”,“线宽”2)传说(“经验幸存者函数”,“低信心绑定”,“上信心绑定”,“威布尔函数幸存者”,“位置”,“东北”)

图包含一个坐标轴对象。坐标轴对象包含x, ylabel S (x)包含4楼梯,类型的对象。这些对象代表经验幸存者函数,降低信心绑定,绑定上信心,幸存者威布尔函数。

威布尔幸存者函数根据实际分布在信心范围内。

计算和绘制模拟double-censored生存数据的累积风险函数。

从Birnbaum-Saunders生成故障时间分布。

rng (“默认”)%的再现性failuretime =随机(“BirnbaumSaunders”、0.3、1、[1]100年);

假设研究开始时0.1和0.9的结束时间。假设意味着失败时间小于0.1剩下审查,审查和失败0.9倍是正确的。

创建一个向量中每个元素表示的审查状态对应的观察failuretime。使用1,1,0表示left-censored right-censored,分别和充分观察观察。

L = 0.1;U = 0.9;left_censored = (failuretime < L);right_censored = (failuretime > U);c = right_censored - left_censored;

情节的经验累积风险函数数据和95%置信界限。

ecdf (failuretime“函数”,“累积风险”,“审查”c“界限”,“上”)

计算和情节结局的经验提供数据。

加载城市数据集。的数据包括九个不同的评级指标329个美国城市的生活质量:气候、住房、健康、犯罪、交通、教育、艺术、娱乐、和经济学。对于每一个指标,更高的评级是更好的。

负载城市

选择第一个指标(气候)作为示例数据。

Y =评级(:1);

假设的指标Y四舍五入为最接近的整数的值。然后,您可以治疗价值Y结局的观察。一个观察yY表明之间的实际评级y - 0.5y + 0.5

创建一个矩阵中每一行代表了间隔周围的每个整数Y

丘陵间低地= (Y - 0.5, Y + 0.5);

计算经验提供值。

(f (x) = ecdf(丘陵间低地);

情节经验提供的值。

图ecdf(丘陵间低地)

图包含一个坐标轴对象。坐标轴对象包含x, ylabel F (x)包含2线类型的对象,补丁。

放大一个较小的区域看区间估计。

idx_roi = 30;xlim ([x (idx_roi (1), 1) x (idx_roi(结束),2)))

图包含一个坐标轴对象。坐标轴对象包含x, ylabel F (x)包含2线类型的对象,补丁。

显示相应的xf值。

表(idx_roi ', x (idx_roi:), f (idx_roi:)“VariableNames”,{“指数”,“x”,“经验提供F (x)”})
ans =10×3表指数x经验提供F (x) _____________ _____ * * * 21日22 377.5 378.5 0.069909 382.5 383.5 0.075988 23日25 24 390.5 391.5 0.082067 384.5 385.5 0.079027 395.5 396.5 0.085106 397.5 398.5 0.091185 26日27日401.5 402.5 0.097264 400.5 401.5 0.094225 28 29 30 409.5 410.5 0.10638 403.5 404.5 0.10334

阴影的矩形表示经验提供值的变化F (x)在相应的时间间隔。例如,从左边第二个阴影矩形放大图对应的区间(382.5,383.5]。(382.5)为0.075988,F(383.5)是0.079027,和发生变化从0.075988到0.079027的区间(382.5,383.5]。变化的具体时间是不确定的。

你可以用不同的方法绘制区间估计。如果你假设概率改变发生在每个区间的开始,你可以画出F (x)使用x的第一列值。

图楼梯(x (: 1), f)标题(的概率变化开始时)包含(“x”)ylabel (“F (x)”)xlim ([x (idx_roi (1), 1) x (idx_roi(结束),2)))

图包含一个坐标轴对象。坐标轴对象与标题概率变化开始,包含x, ylabel F (x)包含一个楼梯类型的对象。

或者,你可以画出F (x)值使用x的第二列和假设的概率变化发生在每个区间的结束。

图楼梯(x (:, 2), f)标题(“最后概率的变化”)包含(“x”)ylabel (“F (x)”)xlim ([x (idx_roi (1), 1) x (idx_roi(结束),2)))

图包含一个坐标轴对象。坐标轴对象与标题最后概率变化,包含x, ylabel F (x)包含一个楼梯类型的对象。

结合前两块间隔形象化。

图楼梯(x (: 1), f)楼梯(x (:, 2), f)标题(“概率区间的变化”)包含(“x”)ylabel (“F (x)”)xlim ([x (idx_roi (1), 1) x (idx_roi(结束),2)])

图包含一个坐标轴对象。坐标轴对象与标题概率区间的变化,包含x, ylabel F (x)包含2楼梯类型的对象。

计算经验累积分布函数(cdf)数据,并创建一个分段线性分布对象使用经验提供一个近似。

加载示例数据。使用柱状图可视化病人体重数据。

负载病人直方图(重量(strcmp(性别、“女”)))直方图(重量(strcmp(性别、“男”)))传说(“女”,“男”)

图包含一个坐标轴对象。坐标轴对象包含2直方图类型的对象。这些对象是女性,男性。

直方图显示数据有两种模式,一个女病人和一个男性患者。

计算的经验提供数据。

(f (x) = ecdf(重量);

构造一个分段线性近似的经验提供价值每五分。

f = f(1:5:结束);x = x(1:5:结束);

实证cdf和近似的阴谋。

图ecdf(重量)情节(x, f,“ko - - - - - -”,“MarkerFace”,“r”)传说(“经验提供”,分段线性近似的,“位置”,“最佳”)

图包含一个坐标轴对象。坐标轴对象包含x, ylabel F (x)包含2楼梯,类型的对象。这些对象代表经验提供,分段线性近似。

创建一个使用分段近似分段线性概率分布对象的经验提供。

pd = makedist (“PiecewiseLinear”,“x”,x,“外汇”f)
pd = PiecewiseLinearDistribution F (111) = 0 F (118) = 0.05 F (124) = 0.13 F (130) = 0.25 F (135) = 0.37 F (142) = 0.5 F (163) = 0.55 F (171) = 0.61 F (178) = 0.7 F (183) = 0.82 F (189) = 0.94 F (202) = 1

产生100分布的随机数。

rng (“默认”)%的再现性rw =随机(pd,[1] 100年);

情节随机数来直观地比较原始数据的分布。

图直方图(重量)直方图(rw)传说(“原始数据”,生成的数据的)

图包含一个坐标轴对象。坐标轴对象包含2直方图类型的对象。这些对象代表原始数据,生成的数据。

分段线性分布的随机数生成具有相同的双峰分布与原始数据。

输入参数

全部折叠

样本数据和审查信息,指定为一个向量样本数据或一个两列的矩阵的示例数据和审查信息。

您可以指定的审查信息通过使用示例数据y参数或审查名称-值参数。ecdf忽略了审查如果参数值y是一个两列矩阵。

指定y作为一个向量或一个两列矩阵根据审查类型的观察y

  • 完全观测数据,指定y作为一个向量样本数据。

  • 数据包含充分观察、left-censored或right-censored观察——指定y作为样本数据的一个向量,并指定审查名称-值参数作为一个为每一个观测向量包含审查信息。的审查向量可以包含0,1,1,指充分观察,left-censored,分别和right-censored观察。

  • 数据,包括结局观察——指定y两列矩阵的示例数据和审查信息。每一行的y指定的范围可能生存或失败时间的每一个观察,并能有其中一个值。

    • (t, t)——完全观察到t

    • (负无穷,t)——Left-censoredt

    • (t,正)——Right-censoredt

    • [t1t2]——结局之间[t1t2],在那里t1<t2

ecdf忽略了y。此外,任何审查中的值向量(审查)或频率向量(频率)原因ecdf忽略中相应的行y

数据类型:|

目标坐标的图ecdf情节,指定为一个对象。

例如,如果h是一个目标对象图,然后ecdf可以画出的图,如以下示例所示。

例子:ecdf (h, x)

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:“审查”,c,“功能”,“累积风险”、“阿尔法”,0.025,“边界”,“上”指示ecdf返回累积风险函数和97.5%的置信范围,规定会计审查数据向量c

返回类型的函数ecdf,指定为一个值。

价值 描述
“提供”(默认) 累积分布函数(cdf)
“幸存者” 幸存者函数
“累积风险” 累积风险函数

例子:“函数”、“累积风险的

的审查指标数据,指定为一个向量组成的0,1,1,这表明充分观察,left-censored,分别和right-censored观察。每个元素的审查值表示的审查状态对应的观察y。的审查值必须有相同的大小y。默认是一个向量的0,表明所有的观察都是完全遵守。

你不能使用这个参数指定结局观察。如果样本数据包含结局观察,指定y使用一个两列的矩阵。ecdf忽略了审查如果价值y是一个两列矩阵。

ecdf忽略任何一个审查中的值向量。此外,任何y或频率向量(频率)原因ecdf忽略相应的审查向量中的值。

例子:审查,审查,在那里审查是一个向量,其中包含审查信息。

数据类型:逻辑||

频率的观测,指定为一个向量的非负整数数相同的行数y。的j的th元素频率值的次数jth排y被观察到。默认是1 s的向量,表示每排一个观察y

ecdf忽略任何一个在这个频率值向量。此外,任何y或审查向量(审查)原因ecdf忽略相应的频率向量中的值。

例子:的频率,频率,在那里频率是一个向量包含观测频率。

数据类型:|

最大迭代次数,指定为一个正整数。这个论点是有效的只有double-censored数据和结局数据。

例子:e5 IterationLimit, 1

数据类型:|

终止公差函数值f,指定为一个积极的标量。这个论点是有效的只有double-censored数据和结局数据。

例子:“宽容”,1 e-5

数据类型:|

频率的迭代凸弱函数(ICM)步骤中,指定为一个正整数。这个论点是有效的只有结局数据。

ecdf使用采用迭代凸弱函数(EMICM)算法[5]计算输出f结局数据。EMICM算法使用EM算法或ICM在每个迭代算法。ecdf运行指定的ICM每步的迭代次数。例如,在默认情况下,ecdf迭代EM步骤9次,ICM步骤运行一次,然后回到他们的一步。

例子:“ICMFrequency”, 1

数据类型:|

显著性水平的置信区间评估函数,指定为一个标量范围(0,1)。默认是0.05 95%的信心。对于一个给定的值α信心水平100(1 -α)%。

这个论点为结局数据是无效的。

例子:“阿尔法”,0.01指定了置信水平99%。

数据类型:|

指标包括信心界限图,指定为其中一个值。

价值 描述
“关闭”(默认) 省略的信心。
“上” 包括边界的信心。

这个论点为结局数据是无效的。

请注意

这个论点是有效的策划。

例子:“界限”,“上”

输出参数

全部折叠

点或间隔的评价函数值x,作为一个列向量返回。

  • 点估计表明,函数值x(我)f(我)

  • 区间估计表明,函数值的变化f(张)f(我)时间间隔内(x (1),x(我,2)]。变化的具体时间是不确定的。例如,看到的结局数据的实证提供

的函数类型f可以是cdf(默认)幸存者函数,或累积风险函数指定的函数名称-值参数。

评估点或间隔,指定为一个列向量或一个两列矩阵,分别。

  • ecdf返回一个列向量为充分观察,left-censored right-censored, double-censored数据。

    • 充分观察、left-censored和right-censored数据,ecdf删除审查观测值y,剩下的值,删除重复的值的排序值,并将结果保存到输出x

    • 对于double-censored数据,ecdf确定哪些值y对应于事件,类型的值,删除重复的值的排序值,并将结果保存到输出x

    输出x包含的最小值y作为两个值。这两个值是有用的为策划的输出ecdf使用楼梯函数。

  • ecdf返回一个两列结局数据矩阵。ecdf评估函数值f不时被称为特恩布尔的间隔。有关详细信息,请参见算法

低自信的评估函数,返回一个列向量。ecdf计算每个观测的束缚。弗洛不是一个同步的曲线。

这个论点为结局数据是无效的。

上信心开往评估函数,返回一个列向量。ecdf计算每个观测的束缚。管理方不是一个同步的曲线。

这个论点为结局数据是无效的。

更多关于

全部折叠

审查类型

ecdf金宝app支持left-censored right-censored,结局观察。

  • Left-censored观察时间t——事件发生之前的时间t,具体的事件时间不详。

  • Right-censored观察时间t——事件发生后时间t,具体的事件时间不详。

  • 结局观察区间内[t1t2]——事件发生后时间t1在时间之前t2,具体的事件时间不详。

Double-censored数据包括left-censored和right-censored观察。

幸存者函数

生存的生存函数的概率作为时间的函数。它也被称为幸存者函数。

生存函数的概率给个体的存活时间超过一定值。因为累积分布函数F(t)的概率是生存时间是小于或等于给定的点t随着时间的推移,持续的生存函数分布年代(t)是补的累积分布函数:年代(t)= 1 -F(t)

累积风险函数

风险函数h(t)是个体的瞬时失败率条件的个人活了下来,直到给定的时间。的累积风险函数H(t)是时间的累积风险t

h ( t ) = lim Δ t 0 P ( t T < t + Δ t | T t ) Δ t ,

H ( t ) = 0 t h ( u ) d u

风险函数总是积极的价值。然而,这些值不符合概率,可以大于1。

你可以获得的累积风险函数值幸存者函数年代(t)使用的关系年代(t)= exp (-H(t))

算法

ecdf计算函数值(f)和信心范围(弗洛管理方)使用不同的算法,根据审查信息。的函数类型f可以是cdf(默认)幸存者函数,或累积风险函数指定的函数名称-值参数。

审查类型 算法f 算法弗洛管理方
Right-censored数据,其中包含完全观察到或Right-censored观察
  • 使用cdf实验组和幸存者的kaplan meier估计函数值。

    kaplan meier估计量 年代 ^ ( t ) 是由

    年代 ^ ( t ) = t < t r d r ,

    在哪里r是观察的数量风险时间吗t,d是失败的数量在时间吗t。更多细节,请参阅kaplan meier方法

  • 使用Nelson-Aalen估计量的累积风险函数值。

    由Nelson-Aalen估计量

    H ^ ( t ) = t < t d r

使用格林伍德的公式,这是一个近似kaplan meier估计量的方差。

的方差估计

V ( 年代 ^ ( t ) ) = 年代 ^ 2 ( t ) t < t d r ( r d )

Left-censored数据,其中包含完全观察到或Left-censored观察

使用kaplan meier估计量。

使用格林公式。

Double-censored数据,包括right-censored和left-censored观察

特恩布尔使用的算法[3][4]。您可以指定的最大迭代数(IterationLimit)和终止公差函数值(宽容)算法。

使用费舍尔信息矩阵。

结局的数据,其中包括结局观察
  • 使用采用迭代凸弱函数(EMICM)算法[5]。EMICM算法使用EM算法或ICM在每个迭代算法。的ICMFrequency名称-值参数决定了ICM的频率算法。ecdf运行指定的ICM每步的迭代次数。默认情况下,ecdf迭代EM步骤9次,ICM步骤运行一次,然后回到他们的一步。您可以指定的最大迭代数(IterationLimit)和终止公差函数值(宽容)算法。

  • ecdf结构互不相交的时间间隔,称为特恩布尔的间隔,两列矩阵的数据y特恩布尔,并返回间隔(x)和估计(f在间隔)。的左边界间隔的第一列y,右边界的间隔从第二列y。充分观察观察(用两个相同的值的行[t t]),转换函数[t t][t-eps t (t))创建一个与非零长度区间构造特恩布尔之前的间隔。

不支持金宝app

引用

[1]考克斯·d·R。,D. Oakes.生存数据的分析。伦敦:查普曼&大厅,1984。

[2]无法无天,j·F。寿命数据的统计模型和方法。第二版,霍博肯,台北:约翰·威利& Sons Inc ., 2003年。

[3]克莱因,约翰P。,Melvin L. Moeschberger.生存分析:审查和截断数据的技术。第二版,生物学和卫生统计数据。纽约:施普林格,2003年。

特恩布尔[4],布鲁斯·W。“生存函数的非参数估计与双重审查数据。”美国统计协会杂志》上69年,345号(1974):169 - 73。

[5]Anderson-Bergman,克利福德。“EMICM算法的高效实现区间NPMLE。”计算和图形统计杂志》上26日,没有。2(2017年4月3日):463 - 67。

[6]器皿,詹姆斯·H。,David L. Demets. "Reanalysis of Some Baboon Descent Data."生物识别技术32岁的没有。2(1976年6月):459 - 63。

扩展功能

版本历史

之前介绍过的R2006a