主要内容

CompactLinearModel

紧线性回归模型

描述

CompactLinearModel是完整线性回归模型对象的紧凑版本吗LinearModel.由于紧凑模型不存储用于拟合模型的输入数据或与拟合过程相关的信息,因此,压缩模型不存储用于拟合模型的输入数据或与拟合过程相关的信息CompactLinearModel对象比LinearModel对象。您仍然可以使用一个紧凑的模型来预测使用新输入数据的响应,但有些LinearModel对象函数不适用于紧凑模型。

创建

创建一个CompactLinearModel从一个完整的,训练有素的模型LinearModel模型通过使用紧凑的

属性

全部展开

系数估计

此属性是只读的。

系数估计的协方差矩阵,指定为p——- - - - - -p数值矩阵。p为拟合模型中系数的个数。

有关详细信息,请参见标准误差和置信区间

数据类型:|

此属性是只读的。

系数名称,指定为字符向量的单元数组,每个单元包含相应项的名称。

数据类型:细胞

此属性是只读的。

系数值,指定为表。系数包含每行系数和这些列:

  • 估计-估计系数值

  • SE-估计的标准误差

  • tStat- - - - - -t-系数为零的测试的统计量

  • pValue- - - - - -p价值的t统计

使用方差分析(仅适用于线性回归模型)或coefTest对系数进行其他测试。使用coefCI找出系数估计的置信区间。

要获取这些列中的任何一列作为向量,请使用点表示法在属性中建立索引。例如,得到模型中估计的系数向量mdl

β= mdl.Coefficients.Estimate

数据类型:表格

此属性是只读的。

模型系数的数目,指定为正整数。NumCoefficients包括当模型项缺乏等级时设置为零的系数。

数据类型:

此属性是只读的。

模型中估计系数的数目,指定为正整数。NumEstimatedCoefficients不包括当模型项缺乏等级时被设为零的系数。NumEstimatedCoefficients是回归的自由度。

数据类型:

摘要统计信息

此属性是只读的。

误差(残差)的自由度,等于观测数减去估计系数数,指定为正整数。

数据类型:

此属性是只读的。

响应值的对数似然,指定为一个数值,基于每个响应值服从正态分布的假设。正态分布的均值是拟合的(预测的)响应值,方差是均方误差

数据类型:|

此属性是只读的。

模型比较标准,指定为具有以下字段的结构:

  • 另类投资会议-赤池信息准则。AIC = -2 *logL + 2*m,在那里logLloglikelihood和为估计参数的个数。

  • AICc-赤池信息标准修正的样本量。AIC = AIC + (2*m*(m + 1))/(n - m - 1),在那里n为观察次数。

  • BIC-贝叶斯信息准则。BIC = -2 *logL + m*log(n)

  • 中安集团经贸-一致的赤池信息准则。CAIC = -2 *logL + m*(log(n) + 1)

信息标准是模型选择工具,您可以使用它来比较适合同一数据的多个模型。这些标准是基于可能性的模型拟合度量,其中包括对复杂性的惩罚(特别是参数的数量)。不同的信息标准通过惩罚的形式来区分。

当比较多个模型时,信息准则值最低的模型是拟合最好的模型。最佳拟合模型可以根据模型比较所用的标准而变化。

要获取标量形式的任何标准值,请使用点表示法在属性中建立索引。例如,获取AIC值另类投资会议在模型中mdl

aic = mdl.ModelCriterion.AIC

数据类型:结构体

此属性是只读的。

均方误差(残差),指定为数值。

均方误差上交所/教育部

在哪里均方误差为均方误差,上交所是误差平方和,和教育部是自由度。

数据类型:|

此属性是只读的。

均方根误差(残差),指定为一个数值。

RMSE=√均方误差),

在哪里RMSE是否均方根误差和均方误差为均方误差。

数据类型:|

此属性是只读的。

模型的r平方值,指定为具有两个字段的结构:

  • 普通的-普通(未调整)r平方

  • 调整- r平方调整系数的数量

r平方值是模型所解释的总平方和的比例。一般的r平方值与苏维埃社会主义共和国风场属性:

Rsquared = SSR /风场

在哪里风场是总平方和,和苏维埃社会主义共和国为回归平方和。

有关详细信息,请参见决定系数(R-Squared)

要获取这些值中的任何一个作为标量,请使用点表示法在属性中建立索引。例如,获取模型中调整后的r平方值mdl

r2 = mdl.Rsquared.Adjusted

数据类型:结构体

此属性是只读的。

误差的平方和(残差),指定为一个数值。

勾股定理意味着

SST = sse + SSR

在哪里风场是总平方和,上交所是误差平方和,和苏维埃社会主义共和国为回归平方和。

数据类型:|

此属性是只读的。

回归平方和,指定为一个数值。回归平方和等于拟合值离均值的方差平方和。

勾股定理意味着

SST = sse + SSR

在哪里风场是总平方和,上交所是误差平方和,和苏维埃社会主义共和国为回归平方和。

数据类型:|

此属性是只读的。

用数值指定的平方和的总和。总平方和等于响应向量的偏差平方和y意思是(y)

勾股定理意味着

SST = sse + SSR

在哪里风场是总平方和,上交所是误差平方和,和苏维埃社会主义共和国为回归平方和。

数据类型:|

拟合方法

此属性是只读的。

鲁棒拟合信息,指定为具有本表中描述字段的结构。

描述
WgtFun 鲁棒加权函数,如“bisquare”(见“RobustOpts”
调优 调优常数。此字段为空([])如果WgtFun“ols”或者,如果WgtFun是带有默认调优常数1的自定义权重函数的函数句柄。
权重 鲁棒拟合最后迭代所用的权值向量。对象的该字段为空CompactLinearModel对象。

这个结构是空的,除非您使用稳健回归拟合模型。

数据类型:结构体

输入数据

此属性是只读的。

模型信息,指定为LinearFormula对象。

显示拟合模型的公式mdl使用点符号:

mdl。公式

此属性是只读的。

用于拟合的拟合函数的观测数,指定为正整数。NumObservations原始表、数据集或矩阵中提供的观察数是否减去任何排除的行(用“排除”名称-值对参数)或缺少值的行。

数据类型:

此属性是只读的。

用于拟合模型的预测变量数量,指定为正整数。

数据类型:

此属性是只读的。

输入数据中变量的数量,指定为正整数。NumVariables为原始表或数据集中变量的数量,或预测器矩阵和响应向量中列的总数。

NumVariables也包括任何变量,不是用来适合模型作为预测或作为响应。

数据类型:

此属性是只读的。

用于拟合模型的预测器名称,指定为字符向量的单元数组。

数据类型:细胞

此属性是只读的。

响应变量名,指定为字符向量。

数据类型:字符

此属性是只读的。

包含变量的信息变量,指定为一个表,每个变量和表中描述的列对应一行。

描述
变量类,指定为字符向量的单元格数组,例如“双”“分类”
范围

变量范围,指定为向量单元格数组

  • 连续变量-二元向量最小值马克斯,最小值和最大值

  • 分类变量-不同变量值的向量

InModel 在拟合模型中的变量的指示符,指定为逻辑向量。这个值是真正的如果模型包含变量。
IsCategorical 分类变量的指示符,指定为逻辑向量。这个值是真正的如果变量是绝对的。

VariableInfo也包括任何变量,不是用来适合模型作为预测或作为响应。

数据类型:表格

此属性是只读的。

变量名,指定为字符向量的单元格数组。

  • 如果适合基于表或数据集,则此属性提供表或数据集中变量的名称。

  • 如果拟合是基于预测矩阵和响应向量,VariableNames属性指定的值“VarNames”拟合方法的名称-值对参数。的默认值“VarNames”{x1, x2,…,‘xn’,‘y’}

VariableNames也包括任何变量,不是用来适合模型作为预测或作为响应。

数据类型:细胞

对象的功能

全部展开

函数宏指令 预测线性回归模型的反应使用一个输入为每个预测器
预测 预测线性回归模型的响应
随机 用线性回归模型模拟随机噪声下的响应
方差分析 线性回归模型的方差分析
coefCI 线性回归模型系数估计的置信区间
coefTest 线性回归模型系数的线性假设检验
partialDependence 计算部分依赖
plotEffects 在线性回归模型中绘制预测因子的主要作用
plotInteraction 在线性回归模型中绘制两个预测因子的交互作用
plotPartialDependence 创建部分依赖图(PDP)和个人条件期望图(ICE)
plotSlice 通过拟合的线性回归曲面绘制切片图
收集 收集的属性统计和机器学习工具箱对象从GPU

例子

全部折叠

对数据拟合一个线性回归模型,并通过丢弃样本数据和一些与拟合过程相关的信息来减少一个完整的、拟合的线性回归模型的大小。

加载largedata4reg数据集,其中包含15,000个观察和45个预测变量。

负载largedata4reg

用线性回归模型拟合数据。

mdl = fitlm (X, Y);

紧凑的模型。

compactMdl =紧凑(mdl);

紧凑模型舍弃了原始样本数据和一些与拟合过程有关的信息。

比较完整模型的大小mdl紧凑型模型compactMdl

var =谁(“compactMdl”“mdl”);(var (1) .bytes一样,var (2) .bytes]
ans =1×281537 11408528

紧凑型比全型消耗的内存更少。

扩展功能

介绍了R2016a