主要内容

CompactGeneralizedLinearModel

紧凑广义线性回归模型类

描述

CompactGeneralizedLinearModel是一个完整的广义线性回归模型对象的精简版本吗GeneralizedLinearModel.因为紧凑型模型不存储用于拟合模型的输入数据或与拟合过程相关的信息CompactGeneralizedLinearModel对象占用的内存小于GeneralizedLinearModel对象。您仍然可以使用一个紧凑的模型来预测使用新的输入数据的响应,但是有些GeneralizedLinearModel对象函数不适用于紧凑模型。

创建

创建一个CompactGeneralizedLinearModel从一个完整的,训练有素的模型GeneralizedLinearModel模型通过使用紧凑的

fitglm返回CompactGeneralizedLinearModel当您使用高数组时,并返回GeneralizedLinearModel当您使用内存中的表和数组时。

属性

全部展开

系数估计

该属性是只读的。

系数估计的协方差矩阵,用a表示p——- - - - - -p数值矩阵。p为拟合模型中系数的个数。

有关详细信息,请参见标准误差和置信区间

数据类型:|

该属性是只读的。

系数名称,指定为字符向量的单元格数组,每个单元格包含对应项的名称。

数据类型:细胞

该属性是只读的。

系数值,以表表示。系数包含一行每个系数和这些列:

  • 估计-估计系数值

  • SE-估计的标准误差

  • tStat- - - - - -t-统计量用于检验系数为零

  • pValue- - - - - -p价值的t统计

使用方差分析(仅适用于线性回归模型)或coefTest对系数进行其他测试。使用coefCI求系数估计的置信区间。

若要获得这些列中的任何一列作为向量,请使用点表示法对属性进行索引。例如,得到模型中估计的系数向量mdl

β= mdl.Coefficients.Estimate

数据类型:表格

该属性是只读的。

模型系数的数目,指定为正整数。NumCoefficients包括当模型项缺乏秩时设为零的系数。

数据类型:

该属性是只读的。

模型中估计系数的个数,指定为正整数。NumEstimatedCoefficients不包括当模型项缺乏秩时设为零的系数。NumEstimatedCoefficients为回归的自由度。

数据类型:

摘要统计信息

该属性是只读的。

用数值指定的配合偏差。当一个模型是另一个模型的特殊情况时,这种偏差对于比较两个模型是有用的。两种模型的偏差之差呈卡方分布,自由度等于两种模型的估计参数个数之差。有关更多信息,请参见异常

数据类型:|

该属性是只读的。

误差(残差)的自由度,等于观测数减去估计系数数,指定为正整数。

数据类型:

该属性是只读的。

响应方差的比例因子,指定为数值标量。

如果“DispersionFlag”的名称-值对参数fitglmstepwiseglm真正的,则函数估计分散计算响应方差的比例因子。响应的方差等于理论方差乘以比例因子。

例如,二项分布的方差函数为p(1 -p) /n,在那里p概率参数是和吗n为样本量参数。如果分散近了1,数据的方差似乎与二项分布的理论方差一致。如果分散大于1,数据集相对于二项分布是“过度分散”的。

数据类型:

该属性是只读的。

标志,以指示是否fitglm使用了分散按比例因子计算中系数的标准误差系数。SE,指定为逻辑值。如果DispersionEstimatedfitglm采用方差的理论值。

  • DispersionEstimated可以只适用于二项分布和泊松分布。

  • DispersionEstimated通过设置“DispersionFlag”的名称-值对参数fitglmstepwiseglm

数据类型:逻辑

该属性是只读的。

在响应值处模型分布的对数似然性,指定为数值。平均值从模型拟合,其他参数估计作为模型拟合的一部分。

数据类型:|

该属性是只读的。

模型比较的标准,指定为具有以下字段的结构:

  • 另类投资会议-赤科信息准则。AIC = -2 *logL + 2*m,在那里logLloglikelihood和为估计参数个数。

  • AICc-修正了Akaike信息标准的样本量。AICc = AIC + (2*m*(m + 1))/(n - m - 1),在那里n是观察的次数。

  • BIC-贝叶斯信息准则。BIC = -2 *logL + m* logn

  • 中安集团经贸-一致的Akaike信息标准。CAIC = -2 *logL + m*(log(n) + 1)

信息标准是模型选择工具,您可以使用它来比较适合相同数据的多个模型。这些标准是基于可能性的模型拟合度量,其中包括对复杂性的惩罚(特别是参数的数量)。不同的信息标准以处罚的形式来区分。

当比较多个模型时,信息准则值最低的模型是最佳拟合模型。根据模型比较所用的标准,最佳拟合模型可能有所不同。

若要以标量形式获得任何标准值,请使用点表示法对属性进行索引。例如,获取AIC值另类投资会议在模型中mdl

aic = mdl.ModelCriterion.AIC

数据类型:结构体

该属性是只读的。

模型的r平方值,指定为具有5个字段的结构。

描述 方程
普通的 普通(调整)的平方

R 普通的 2 1 上交所 风场

上交所误差的平方和是和吗风场为响应向量偏离均值的平方和。

调整 r平方调整了系数的数量

R 调整 2 1 上交所 风场 N 1 教育部

N为观测次数(NumObservations),教育部为误差(残差)的自由度。

LLR Loglikelihood比率

R LLR 2 1 l l 0

l为拟合模型的对数似然(LogLikelihood),l0仅包含常数项的模型的对数似然。R2LLR麦克法登伪r平方值是多少[1]逻辑回归模型。

异常 偏差平方

R 异常 2 1 D D 0

D为拟合模型的偏差(异常),D0是仅包含常数项的模型的偏差。

AdjGeneralized 调整广义平方

R AdjGeneralized 2 1 经验值 2 l 0 l N 1 经验值 2 l 0 N

R2AdjGeneralized是Nagelkerke调整吗[2]按照马德拉提出的方案[3]考克斯和斯内尔[4],麦基[5]逻辑回归模型。

若要获得这些值中的任意一个标量,请使用点表示法对属性进行索引。例如,得到模型中调整后的r平方值mdl,输入:

r2 = mdl.Rsquared.Adjusted

数据类型:结构体

该属性是只读的。

误差的平方和(残差),指定为数值。

数据类型:|

该属性是只读的。

平方和的回归和,指定为数值。回归平方和等于拟合值偏离均值的平方和。

数据类型:|

该属性是只读的。

平方和的总和,指定为数值。总平方和等于响应向量偏差的平方和y意思是(y)

数据类型:|

输入数据

该属性是只读的。

广义分布信息,指定为具有表中描述的字段的结构。

描述
的名字 分布名称:“正常”“二”“泊松”“伽马”,或逆高斯分布的
DevianceFunction 一个函数,它以拟合参数值和响应值的函数的形式计算偏差的分量
VarianceFunction 作为拟合参数值的函数,计算分布的理论方差。当DispersionEstimated真正的,软件将方差函数乘以分散在计算系数时存在标准误差。

数据类型:结构体

该属性是只读的。

模型信息,指定为LinearFormula对象。

显示拟合模型的公式mdl使用点符号:

mdl。F或米ula

该属性是只读的。

用于拟合的拟合函数的观测数,指定为正整数。NumObservations原始表、数据集或矩阵中提供的观察数减去任何排除的行(用“排除”名称-值对参数)或缺少值的行。

数据类型:

该属性是只读的。

用于拟合模型的预测器变量数,指定为正整数。

数据类型:

该属性是只读的。

输入数据中指定为正整数的变量数。NumVariables为原始表或数据集中的变量数量,或预测器矩阵和响应向量中的列总数。

NumVariables还包括未用于将模型作为预测器或响应来拟合的任何变量。

数据类型:

该属性是只读的。

用于匹配模型的预测器的名称,指定为字符向量的单元格数组。

数据类型:细胞

该属性是只读的。

响应变量名,指定为字符向量。

数据类型:字符

该属性是只读的。

中包含的变量信息变量,指定为一个表,其中每个变量和该表中描述的列对应一行。

描述
变量类,指定为字符向量的单元格数组,例如“双”“分类”
范围

变量范围,指定为向量的单元格数组

  • 连续变量-二元向量最小值马克斯,最小值和最大值

  • 分类变量-不同变量值的向量

InModel 在拟合模型中的变量的指示符,指定为逻辑向量。这个值是真正的如果模型包含变量。
IsCategorical 分类变量的指示符,指定为逻辑向量。这个值是真正的如果变量是分类的。

VariableInfo还包括未用于将模型作为预测器或响应来拟合的任何变量。

数据类型:表格

该属性是只读的。

变量的名称,指定为字符向量的单元格数组。

  • 如果匹配基于表或数据集,则此属性提供表或数据集中的变量名称。

  • 如果拟合是基于预测器矩阵和响应向量,VariableNames对象指定的值“VarNames”拟合方法的名称-值对参数。的默认值“VarNames”{x1, x2,…,‘xn’,‘y’}

VariableNames还包括未用于将模型作为预测器或响应来拟合的任何变量。

数据类型:细胞

对象的功能

全部展开

函数宏指令 预测广义线性回归模型的反应使用一个输入为每个预测器
预测 预测广义线性回归模型的响应
随机 对广义线性回归模型进行随机噪声响应模拟
coefCI 广义线性回归模型系数估计的置信区间
coefTest 广义线性回归模型系数的线性假设检验
devianceTest 广义线性回归模型的偏差分析
partialDependence 计算部分依赖
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望图(ICE)
plotSlice 通过拟合的广义线性回归曲面绘制切片图
收集 收集的属性统计和机器学习工具箱对象从GPU

例子

全部折叠

将一个广义线性回归模型拟合到数据中,通过丢弃样本数据和一些与拟合过程相关的信息来减小一个完整的拟合模型的尺寸。

加载largedata4reg数据集,其中包含15,000个观察和45个预测变量。

负载largedata4reg

使用前15个预测变量拟合一个广义线性回归模型到数据。

mdl = fitglm (X (: 1:15), Y);

紧凑的模型。

compactMdl =紧凑(mdl);

紧凑型模型丢弃了原始样本数据和拟合过程相关的一些信息,因此比完整模型占用的内存少。

比较整个模型的大小mdl紧凑型compactMdl

var =谁(“compactMdl”“mdl”);(var (1) .bytes一样,var (2) .bytes]
ans =1×215517 4382500

紧凑型比全型占用更少的内存。

更多关于

全部展开

参考文献

[1]麦克费登,丹尼尔。定性选择行为的条件logit分析>计量经济学前沿, P. Zarembka编辑,105-42。纽约:学术出版社,1974年。

内克尔克,新泽西州。《决定系数的一般定义注记》生物统计学78年,没有。3(1991): 691 - 92。

甘加达拉奥的马达拉。计量经济学中的有限因变量和定性变量。计量经济学社会专著。纽约,纽约:剑桥大学出版社,1983年。

考克斯,d。R。和e。j。斯内尔。二进制数据分析。《统计学与应用概率论》伦敦;纽约:查普曼和霍尔出版社,1989。

[5]麦基,朗尼。基于Wald和似然比联合显著性检验的r2测度美国统计学家44岁的没有。3(1990年8月):250-53。

扩展功能

介绍了R2016b