紧凑广义线性回归模型类
CompactGeneralizedLinearModel
是一个完整的广义线性回归模型对象的精简版本吗GeneralizedLinearModel
.因为紧凑型模型不存储用于拟合模型的输入数据或与拟合过程相关的信息CompactGeneralizedLinearModel
对象占用的内存小于GeneralizedLinearModel
对象。您仍然可以使用一个紧凑的模型来预测使用新的输入数据的响应,但是有些GeneralizedLinearModel
对象函数不适用于紧凑模型。
创建一个CompactGeneralizedLinearModel
从一个完整的,训练有素的模型GeneralizedLinearModel
模型通过使用紧凑的
.
fitglm
返回CompactGeneralizedLinearModel
当您使用高数组时,并返回GeneralizedLinearModel
当您使用内存中的表和数组时。
CoefficientCovariance
- - - - - -系数估计的协方差矩阵CoefficientNames
- - - - - -系数的名字该属性是只读的。
系数名称,指定为字符向量的单元格数组,每个单元格包含对应项的名称。
数据类型:细胞
系数
- - - - - -系数值该属性是只读的。
系数值,以表表示。系数
包含一行每个系数和这些列:
估计
-估计系数值
SE
-估计的标准误差
tStat
- - - - - -t-统计量用于检验系数为零
pValue
- - - - - -p价值的t统计
使用方差分析
(仅适用于线性回归模型)或coefTest
对系数进行其他测试。使用coefCI
求系数估计的置信区间。
若要获得这些列中的任何一列作为向量,请使用点表示法对属性进行索引。例如,得到模型中估计的系数向量mdl
:
β= mdl.Coefficients.Estimate
数据类型:表格
NumCoefficients
- - - - - -模型系数数该属性是只读的。
模型系数的数目,指定为正整数。NumCoefficients
包括当模型项缺乏秩时设为零的系数。
数据类型:双
NumEstimatedCoefficients
- - - - - -估计系数数该属性是只读的。
模型中估计系数的个数,指定为正整数。NumEstimatedCoefficients
不包括当模型项缺乏秩时设为零的系数。NumEstimatedCoefficients
为回归的自由度。
数据类型:双
异常
- - - - - -异常的配合该属性是只读的。
用数值指定的配合偏差。当一个模型是另一个模型的特殊情况时,这种偏差对于比较两个模型是有用的。两种模型的偏差之差呈卡方分布,自由度等于两种模型的估计参数个数之差。有关更多信息,请参见异常.
数据类型:单
|双
教育部
- - - - - -误差自由度该属性是只读的。
误差(残差)的自由度,等于观测数减去估计系数数,指定为正整数。
数据类型:双
分散
- - - - - -反应方差的尺度因子该属性是只读的。
响应方差的比例因子,指定为数值标量。
如果“DispersionFlag”
的名称-值对参数fitglm
或stepwiseglm
是真正的
,则函数估计分散
计算响应方差的比例因子。响应的方差等于理论方差乘以比例因子。
例如,二项分布的方差函数为p(1 -p) /n,在那里p概率参数是和吗n为样本量参数。如果分散
近了1
,数据的方差似乎与二项分布的理论方差一致。如果分散
大于1
,数据集相对于二项分布是“过度分散”的。
数据类型:双
DispersionEstimated
- - - - - -表示使用分散比例因子的标志该属性是只读的。
标志,以指示是否fitglm
使用了分散
按比例因子计算中系数的标准误差系数。SE
,指定为逻辑值。如果DispersionEstimated
是假
,fitglm
采用方差的理论值。
DispersionEstimated
可以假
只适用于二项分布和泊松分布。
集DispersionEstimated
通过设置“DispersionFlag”
的名称-值对参数fitglm
或stepwiseglm
.
数据类型:逻辑
LogLikelihood
- - - - - -Loglikelihood该属性是只读的。
在响应值处模型分布的对数似然性,指定为数值。平均值从模型拟合,其他参数估计作为模型拟合的一部分。
数据类型:单
|双
ModelCriterion
- - - - - -模型比较准则该属性是只读的。
模型比较的标准,指定为具有以下字段的结构:
另类投资会议
-赤科信息准则。AIC = -2 *logL + 2*m
,在那里logL
loglikelihood和米
为估计参数个数。
AICc
-修正了Akaike信息标准的样本量。AICc = AIC + (2*m*(m + 1))/(n - m - 1)
,在那里n
是观察的次数。
BIC
-贝叶斯信息准则。BIC = -2 *logL + m* logn
.
中安集团经贸
-一致的Akaike信息标准。CAIC = -2 *logL + m*(log(n) + 1)
.
信息标准是模型选择工具,您可以使用它来比较适合相同数据的多个模型。这些标准是基于可能性的模型拟合度量,其中包括对复杂性的惩罚(特别是参数的数量)。不同的信息标准以处罚的形式来区分。
当比较多个模型时,信息准则值最低的模型是最佳拟合模型。根据模型比较所用的标准,最佳拟合模型可能有所不同。
若要以标量形式获得任何标准值,请使用点表示法对属性进行索引。例如,获取AIC值另类投资会议
在模型中mdl
:
aic = mdl.ModelCriterion.AIC
数据类型:结构体
Rsquared
- - - - - -模型的r平方值该属性是只读的。
模型的r平方值,指定为具有5个字段的结构。
场 | 描述 | 方程 |
---|---|---|
普通的 |
普通(调整)的平方 |
|
调整 |
r平方调整了系数的数量 |
N为观测次数( |
LLR |
Loglikelihood比率 |
l为拟合模型的对数似然( |
异常 |
偏差平方 |
D为拟合模型的偏差( |
AdjGeneralized |
调整广义平方 |
R2AdjGeneralized是Nagelkerke调整吗[2]按照马德拉提出的方案[3]考克斯和斯内尔[4],麦基[5]逻辑回归模型。 |
若要获得这些值中的任意一个标量,请使用点表示法对属性进行索引。例如,得到模型中调整后的r平方值mdl
,输入:
r2 = mdl.Rsquared.Adjusted
数据类型:结构体
上交所
- - - - - -误差平方和该属性是只读的。
误差的平方和(残差),指定为数值。
数据类型:单
|双
苏维埃社会主义共和国
- - - - - -回归平方和该属性是只读的。
平方和的回归和,指定为数值。回归平方和等于拟合值偏离均值的平方和。
数据类型:单
|双
风场
- - - - - -平方和该属性是只读的。
平方和的总和,指定为数值。总平方和等于响应向量偏差的平方和y
从意思是(y)
.
数据类型:单
|双
分布
- - - - - -广义分布信息该属性是只读的。
广义分布信息,指定为具有表中描述的字段的结构。
场 | 描述 |
---|---|
的名字 |
分布名称:“正常” ,“二” ,“泊松” ,“伽马” ,或逆高斯分布的 |
DevianceFunction |
一个函数,它以拟合参数值和响应值的函数的形式计算偏差的分量 |
VarianceFunction |
作为拟合参数值的函数,计算分布的理论方差。当DispersionEstimated 是真正的 ,软件将方差函数乘以分散 在计算系数时存在标准误差。 |
数据类型:结构体
公式
- - - - - -模型信息LinearFormula
对象该属性是只读的。
模型信息,指定为LinearFormula
对象。
显示拟合模型的公式mdl
使用点符号:
mdl。F或米ula
链接
- - - - - -链接功能该属性是只读的。
链接函数,指定为具有本表中描述的字段的结构。
场 | 描述 |
---|---|
的名字 |
链接函数的名称,指定为字符向量。如果使用函数句柄指定链接函数,则的名字 是'' . |
链接 |
函数f定义link函数,指定为函数句柄 |
导数 |
的导数f,指定为函数句柄 |
逆 |
逆的f,指定为函数句柄 |
link函数是一个函数f连接分布参数μ到拟合的线性组合Xb预测:
f(μ) =Xb.
数据类型:结构体
NumObservations
- - - - - -数量的观察该属性是只读的。
用于拟合的拟合函数的观测数,指定为正整数。NumObservations
原始表、数据集或矩阵中提供的观察数减去任何排除的行(用“排除”
名称-值对参数)或缺少值的行。
数据类型:双
NumPredictors
- - - - - -预测变量数该属性是只读的。
用于拟合模型的预测器变量数,指定为正整数。
数据类型:双
NumVariables
- - - - - -数量的变量该属性是只读的。
输入数据中指定为正整数的变量数。NumVariables
为原始表或数据集中的变量数量,或预测器矩阵和响应向量中的列总数。
NumVariables
还包括未用于将模型作为预测器或响应来拟合的任何变量。
数据类型:双
PredictorNames
- - - - - -用于适合模型的预测器名称该属性是只读的。
用于匹配模型的预测器的名称,指定为字符向量的单元格数组。
数据类型:细胞
ResponseName
- - - - - -响应变量名该属性是只读的。
响应变量名,指定为字符向量。
数据类型:字符
VariableInfo
- - - - - -信息变量该属性是只读的。
中包含的变量信息变量
,指定为一个表,其中每个变量和该表中描述的列对应一行。
列 | 描述 |
---|---|
类 |
变量类,指定为字符向量的单元格数组,例如“双” 和“分类” |
范围 |
变量范围,指定为向量的单元格数组
|
InModel |
在拟合模型中的变量的指示符,指定为逻辑向量。这个值是真正的 如果模型包含变量。 |
IsCategorical |
分类变量的指示符,指定为逻辑向量。这个值是真正的 如果变量是分类的。 |
VariableInfo
还包括未用于将模型作为预测器或响应来拟合的任何变量。
数据类型:表格
VariableNames
- - - - - -变量的名字该属性是只读的。
变量的名称,指定为字符向量的单元格数组。
如果匹配基于表或数据集,则此属性提供表或数据集中的变量名称。
如果拟合是基于预测器矩阵和响应向量,VariableNames
对象指定的值“VarNames”
拟合方法的名称-值对参数。的默认值“VarNames”
是{x1, x2,…,‘xn’,‘y’}
.
VariableNames
还包括未用于将模型作为预测器或响应来拟合的任何变量。
数据类型:细胞
coefCI |
广义线性回归模型系数估计的置信区间 |
coefTest |
广义线性回归模型系数的线性假设检验 |
devianceTest |
广义线性回归模型的偏差分析 |
partialDependence |
计算部分依赖 |
plotPartialDependence |
创建部分依赖图(PDP)和个人条件期望图(ICE) |
plotSlice |
通过拟合的广义线性回归曲面绘制切片图 |
收集 |
收集的属性统计和机器学习工具箱对象从GPU |
将一个广义线性回归模型拟合到数据中,通过丢弃样本数据和一些与拟合过程相关的信息来减小一个完整的拟合模型的尺寸。
加载largedata4reg
数据集,其中包含15,000个观察和45个预测变量。
负载largedata4reg
使用前15个预测变量拟合一个广义线性回归模型到数据。
mdl = fitglm (X (: 1:15), Y);
紧凑的模型。
compactMdl =紧凑(mdl);
紧凑型模型丢弃了原始样本数据和拟合过程相关的一些信息,因此比完整模型占用的内存少。
比较整个模型的大小mdl
紧凑型compactMdl
.
var =谁(“compactMdl”,“mdl”);(var (1) .bytes一样,var (2) .bytes]
ans =1×215517 4382500
紧凑型比全型占用更少的内存。
偏差是残差平方和的一种推广。它衡量的是与饱和模型相比的拟合优度。
模型的偏差米1是模型的对数似然差的两倍吗米1和饱和模型米年代.一个饱和模型是一个模型的最大数量的参数,你可以估计。
例如,如果你有n观察(y我,我= 1, 2,…n),可能具有不同的值X我Tβ,然后你可以定义一个饱和模型与n参数。让l(b,y)表示具有参数的模型似然函数的最大值b.然后是模型的偏差米1是
在哪里b1和b年代包含模型的估计参数米1分别为饱和模型。偏差具有卡方分布n- - - - - -p自由度,其中n饱和模型中的参数个数和p是模型中的参数个数吗米1.
假设您有两个不同的广义线性回归模型米1和米2,米1有一个子集的项在米2.你可以通过比较偏差来评估模型的拟合D1和D2两种模型。偏差的区别是
渐近,D具有卡方分布的自由度v等于中估计的参数个数的差值米1和米2.你可以获得p通过使用1 - chi2cdf (D, v)
.
通常,您检查D使用一个模型米2有一个常数项,没有预测。因此,D有卡方分布吗p- 1的自由度。如果估计了色散,那么差除以估计色散有F分布与p- 1分子自由度和n- - - - - -p分母自由度。
[1]麦克费登,丹尼尔。定性选择行为的条件logit分析>计量经济学前沿, P. Zarembka编辑,105-42。纽约:学术出版社,1974年。
内克尔克,新泽西州。《决定系数的一般定义注记》生物统计学78年,没有。3(1991): 691 - 92。
甘加达拉奥的马达拉。计量经济学中的有限因变量和定性变量。计量经济学社会专著。纽约,纽约:剑桥大学出版社,1983年。
考克斯,d。R。和e。j。斯内尔。二进制数据分析。《统计学与应用概率论》伦敦;纽约:查普曼和霍尔出版社,1989。
[5]麦基,朗尼。基于Wald和似然比联合显著性检验的r2测度美国统计学家44岁的没有。3(1990年8月):250-53。
使用注意事项和限制:
当你用fitglm
或stepwiseglm
,则不能指定链接
,导数
,逆
的字段“链接”
作为匿名函数的名称-值对参数。也就是说,您不能使用使用链接的匿名函数创建的通用线性模型来生成代码。相反,为链接组件定义函数。
有关更多信息,请参见代码生成简介.
你点击一个链接对应于这个MATLAB命令:
在MATLAB命令窗口中输入命令运行该命令。Web浏览器不支持MATLAB命令。金宝app
您也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家网站不适合从您的位置访问。