LinearModel

线性回归模型

扩展所有的页面

描述

LinearModel拟合线性回归模型对象。一个回归模型描述了反应和预测之间的关系。线性回归模型的线性是指的线性预测系数。

使用的属性LinearModel对象调查合身的线性回归模型。对象属性包括系数估计信息,汇总统计,拟合方法,输入数据。使用对象函数预测反应和修改,评估,想象的线性回归模型。

创建

创建一个LinearModel对象的使用fitlm或stepwiselm。

fitlm符合数据线性回归模型使用一个固定的模型规范。使用addTerms,removeTerms,或一步从模型中添加或删除条款。另外,使用stepwiselm适合用逐步线性回归模型。

属性

全部展开

系数估计

`CoefficientCovariance`- - - - - -协方差矩阵的系数估计
数字矩阵

这个属性是只读的。

协方差矩阵的系数估计,指定为一个p——- - - - - -p矩阵的数值。p拟合模型中系数的数量。

有关详细信息,请参见系数标准误差和置信区间。

数据类型:单|双

`CoefficientNames`- - - - - -系数的名字
单元阵列的特征向量

这个属性是只读的。

系数名称指定为一个单元阵列的特征向量,每个包含的名称对应的词。

数据类型:细胞

`系数`- - - - - -系数值
表

这个属性是只读的。

系数值,指定为一个表。系数为每个系数和这些列包含一行:

估计——估计系数值
SE-标准误差的估计
tStat- - - - - -t统计测试系数为零
pValue- - - - - -p价值的t统计

使用方差分析(只对一个线性回归模型)或coefTest执行其他测试的系数。使用coefCI找到系数估计的置信区间。

获得这些列向量,索引属性使用点符号。例如,获得的估计系数向量模型mdl:

β= mdl.Coefficients.Estimate

数据类型:表

`NumCoefficients`- - - - - -模型系数的数量
正整数

这个属性是只读的。

数量的模型系数,指定为一个正整数。NumCoefficients包括系数设置为0,当模型方面的不足。

数据类型:双

`NumEstimatedCoefficients`- - - - - -数量的估计系数
正整数

这个属性是只读的。

数量的估计系数模型,指定为一个正整数。NumEstimatedCoefficients不包括系数设置为0,当模型方面的不足。NumEstimatedCoefficients是回归的自由度。

数据类型:双

摘要统计信息

`教育部`- - - - - -自由度为错误
正整数

这个属性是只读的。

自由度的误差(残差),等于观测的数量减去估计系数的数量,指定为一个正整数。

数据类型:双

`诊断`- - - - - -观察诊断
表

这个属性是只读的。

观察诊断,指定为一个表,其中包含为每个观察一行和列在这个表中描述。

列	意义	描述
`利用`	对角元素的`HatMatrix`	`利用`为每个观测表明在多大程度上是由观察到的预测价值。一个值接近`1`表明,在很大程度上取决于正观察,从其他观察几乎没有贡献。一个值接近`0`表明,适合在很大程度上取决于另一个观察。对于一个模型`P`系数和`N`观察,平均价值`利用`是`P / N`。一个`利用`值大于`2 * P / N`表明高杠杆。
`CooksDistance`	库克的距离	`CooksDistance`是一个按比例缩小的拟合值的变化。一个观察`CooksDistance`大于三倍的意思是库克的距离可以是一个局外人。
`Dffits`	Delete-1拟合值的差异	`Dffits`是按比例缩小的变化拟合值为每个观测,观测的结果不包括健康。值大于`2 *倍根号(P / N)`在绝对值可以被认为是有影响力的。
`S2_i`	Delete-1方差	`S2_i`是一组依次删除每个观测获得的剩余方差估计。这些估计可以与均方误差(MSE)值,存储在`均方误差`财产。
`CovRatio`	Delete-1协方差的比率决定因素	`CovRatio`的比值系数的协方差矩阵的行列式,每次观察删除反过来,协方差矩阵的行列式的完整模型。值大于`1 + 3 * P / N`或小于`1 - 3 * P / N`表明有影响力的点。
`Dfbetas`	Delete-1比例系数估计的差异	`Dfbetas`是一个`N`——- - - - - -`P`系数矩阵的扩展变化估计依次扣除每个观测的结果。值大于`3 /√(N)`在绝对值表明,观察相应的系数有很大的影响。
`HatMatrix`	投影矩阵计算`安装`从观察到的响应	`HatMatrix`是一个`N`——- - - - - -`N`矩阵,`安装= HatMatrix * Y`,在那里`Y`响应向量和吗`安装`是拟合响应值的向量。

诊断包含的信息有助于发现异常值和影响力的观察。Delete-1诊断捕捉变化,结果从依次扣除每个观察健康。更多细节,请参阅帽子矩阵和杠杆,库克的距离,Delete-1统计。

使用plotDiagnostics绘制观察诊断。

行中使用不适合,因为(在缺失值ObservationInfo.Missing(在)或排除值ObservationInfo.Excluded)包含南中的值CooksDistance,Dffits,S2_i,CovRatio列和0利用,Dfbetas,HatMatrix列。

获得这些列作为一个数组,索引属性使用点符号。例如,获得delete-1方差向量模型中mdl:

S2i = mdl.Diagnostics.S2_i;

数据类型:表

`安装`- - - - - -根据输入数据拟合响应值
数值向量

这个属性是只读的。

安装(预测)响应值基于输入数据,指定为一个n1数字向量。n在输入数据的数量的观察。使用预测对其他预测值来计算预测或计算置信界限安装。

数据类型:单|双

`LogLikelihood`- - - - - -Loglikelihood
数值

这个属性是只读的。

Loglikelihood响应值,指定为一个数字值,基于假设每个响应值遵循正态分布。正态分布的均值安装(预测)响应值和方差均方误差。

数据类型:单|双

`ModelCriterion`- - - - - -标准模型的比较
结构

这个属性是只读的。

标准模型比较,与这些字段指定为一个结构:

另类投资会议——Akaike信息标准。AIC = 2 * logL + 2 * m,在那里logLloglikelihood和米是估计的数量参数。
AICc——Akaike信息标准样本大小的修正。AICc = AIC + (2 * m * (m + 1) / (n - m - 1),在那里n是观测的数量。
BIC——贝叶斯信息准则。BIC = 2 * logL + m * log (n)。
中安集团经贸——Akaike信息准则一致。中安集团经贸= 2 * logL + m * (log (n) + 1)。

信息标准模型选择工具,您可以使用多个模型比较适合相同的数据。这些标准是基于可能性模型适合的措施,包括惩罚复杂性(具体来说,参数的个数)。不同的信息形式的处罚标准是有区别的。

当你比较多个模型,模型信息准则值最低的最佳拟合模型。最佳拟合模型取决于使用的标准模型的比较。

获得的任何准则值作为一个标量,索引属性使用点符号。例如,获得AIC值另类投资会议在模型中mdl:

aic = mdl.ModelCriterion.AIC

数据类型:结构体

`均方误差`- - - - - -均方误差
数值

这个属性是只读的。

均方误差(残差),指定为一个数值。

均方误差=上交所/教育部,

在哪里均方误差均方误差,上交所是平方误差的总和,教育部的自由度。

数据类型:单|双

`残差`- - - - - -残差拟合模型
表

这个属性是只读的。

残差拟合模型,指定为一个表,其中包含为每个观察一行和列在这个表中描述。

列	描述
`生`	观察-拟合值
`皮尔森`	原始残差除以根均方误差(RMSE)
`标准化`	原始残差除以他们估计的标准偏差
`Studentized`	生残余除以一个独立的剩余标准差的估计。剩余的观察我除以估计误差标准差基于观察除了观察吗我。

使用plotResiduals创建一个残差的情节。有关详细信息,请参见残差。

行中使用不适合,因为(在缺失值ObservationInfo.Missing(在)或排除值ObservationInfo.Excluded)包含南值。

获得这些列向量,索引属性使用点符号。例如,获得原始残余向量r在模型中mdl:

r = mdl.Residuals.Raw

数据类型:表

`RMSE`- - - - - -根均方误差
数值

这个属性是只读的。

根均方误差(残差),指定为一个数值。

RMSE=√均方误差),

在哪里RMSE根均方误差和吗均方误差均方误差。

数据类型:单|双

`Rsquared`- - - - - -平方值的模型
结构

这个属性是只读的。

平方值的模型,用两个字段指定为一个结构:

普通的——普通(调整)的平方
调整——平方调整系数的数量

平方值的比例是总平方和的解释模型。普通的平方值之间的关系苏维埃社会主义共和国和风场属性:

Rsquared = SSR /风场,

在哪里风场是总平方和,苏维埃社会主义共和国回归平方和。

有关详细信息,请参见确定系数(平方)。

获得这些值作为一个标量,索引属性使用点符号。例如,在模型中获得调整的平方值mdl:

r2 = mdl.Rsquared.Adjusted

数据类型:结构体

`上交所`- - - - - -的平方误差的总和
数值

这个属性是只读的。

平方误差的总和(残差),指定为一个数值。

勾股定理意味着

海温= SSE + SSR,

在哪里风场是总平方和,上交所是平方误差的总和,苏维埃社会主义共和国回归平方和。

数据类型:单|双

`苏维埃社会主义共和国`- - - - - -回归平方和
数值

这个属性是只读的。

回归平方和,指定为一个数值。回归平方和等于偏差的平方和的拟合值的意思。

勾股定理意味着

海温= SSE + SSR,

在哪里风场是总平方和,上交所是平方误差的总和,苏维埃社会主义共和国回归平方和。

数据类型:单|双

`风场`- - - - - -总平方和
数值

这个属性是只读的。

总平方和,指定为一个数值。总平方和等于响应向量的偏差的平方和y从意思是(y)。

勾股定理意味着

海温= SSE + SSR,

在哪里风场是总平方和,上交所是平方误差的总和,苏维埃社会主义共和国回归平方和。

数据类型:单|双

拟合方法

`健壮的`- - - - - -健壮的健康信息
结构

这个属性是只读的。

健壮的健康信息,指定为一个结构与此表中描述的领域。

场	描述
`WgtFun`	健壮的权重函数,比如`“bisquare”`(见`“RobustOpts”`)
`调优`	调优常数。这个字段是空的(`[]`)如果`WgtFun`是`“ols”`或者,如果`WgtFun`是一个自定义的函数处理加权函数使用默认调优常数1。
`权重`	在决赛中使用的权重向量迭代强劲的健康。这个字段是空的`CompactLinearModel`对象。

这个结构是空的,除非你适合使用健壮的回归模型。

数据类型:结构体

`步骤`- - - - - -分段拟合的信息
结构

这个属性是只读的。

分段拟合信息,指定为这个表结构描述的领域。

场	描述
`开始`	代表起始模型公式
`较低的`	代表下界公式模型。的条款`较低的`在模型中必须保持。
`上`	代表上限公式模型。该模型不能包含更多的比`上`。
`标准`	标准用于分段算法,如`上交所的`
`被关闭的`	阈值`标准`添加一个术语
`PRemove`	阈值`标准`删除一个术语
`历史`	表代表中所需要的步骤

的历史每一步的表包含一行,包括最初的适应,和列在这个表中描述。

列	描述
`行动`	期间的行动步骤: `“开始”`——第一步 `“添加”`——添加一个术语 `“删除”`——删除一个术语
`TermName`	如果`行动`是`“开始”`,`TermName`指定起始模型规范。如果`行动`是`“添加”`或`“删除”`,`TermName`指定术语添加或删除的步骤。
`条款`	模型规范的计算矩阵
`DF`	回归后的自由度的一步
`delDF`	上一步回归自由度变化的步骤删除一个术语(负)
`异常`	异常(剩余平方和)步骤(只对广义线性回归模型)
`函数`	F统计这导致了一步
`PValue`	p价值的F统计

结构是空的,除非你适合使用逐步回归模型。

数据类型:结构体

输入数据

`公式`- - - - - -模型信息
`LinearFormula`对象

这个属性是只读的。

模型信息,指定为一个LinearFormula对象。

显示的公式拟合模型mdl使用点符号:

mdl.Formula

`NumObservations`- - - - - -数量的观察
正整数

这个属性是只读的。

数用于拟合观测数据的拟合函数,指定为一个正整数。NumObservations是观测的数量提供原始表,数据集,或矩阵,减去任何排除行(设置的“排除”名称-值对参数)或具有缺失值的行。

数据类型:双

`NumPredictors`- - - - - -数量的预测变量
正整数

这个属性是只读的。

以适应模型,使用数量的预测变量指定为一个正整数。

数据类型:双

`NumVariables`- - - - - -数量的变量
正整数

这个属性是只读的。

输入数据的变量数量,指定为一个正整数。NumVariables是变量的数量在原始表或数据集,或预测矩阵中的列的总数和响应向量。

NumVariables还包括任何变量,不习惯适应模型作为预测或响应。

数据类型:双

`ObservationInfo`- - - - - -观测信息
表

这个属性是只读的。

观察信息,指定为一个n表4,n等于输入数据的行数。ObservationInfo包含这个表中描述的列。

列	描述
`权重`	观察体重、指定为一个数值。默认值是`1`。
`被排除在外`	的指标排除观察,指定为一个逻辑值。这个值是`真正的`如果你观察排除在适合使用`“排除”`名称-值对的论点。
`失踪`	失踪的观察指标,指定为一个逻辑值。这个值是`真正的`如果观察失踪。
`子集`	指标的拟合函数是否使用观察,指定为一个逻辑值。这个值是`真正的`如果观察不排除或失踪,这意味着观察拟合函数使用。

获得这些列向量,索引属性使用点符号。例如,获取权向量w模型的mdl:

w = mdl.ObservationInfo.Weights

数据类型:表

`ObservationNames`- - - - - -观察的名字
单元阵列的特征向量

这个属性是只读的。

观察名称指定为特征向量的单元阵列包含观测中使用的名称。

如果符合基于一个表或包含观测数据集名称,ObservationNames使用这些名称。
否则,ObservationNames是一个空单元数组。

数据类型:细胞

`PredictorNames`- - - - - -名字适合使用的预测模型
单元阵列的特征向量

这个属性是只读的。

名字适合使用的预测模型,指定为一个单元阵列的特征向量。

数据类型:细胞

`ResponseName`- - - - - -响应变量名
特征向量

这个属性是只读的。

响应变量名称,指定为一个特征向量。

数据类型:字符

`VariableInfo`- - - - - -信息变量
表

这个属性是只读的。

变量中包含的信息变量,指定为一个表为每个变量与一行和列在这个表中描述。

列	描述
`类`	变量类,指定为一个单元阵列的特征向量,如`“双”`和`“分类”`
`范围`	变量范围,指定为一个单元阵列的向量连续变量——双元素向量`(最小值,马克斯]`的最小值和最大值分类变量的向量不同的变量值
`InModel`	的指标变量的拟合模型,指定为一个逻辑向量。这个值是`真正的`如果模型包括变量。
`IsCategorical`	指标的分类变量指定为一个逻辑向量。这个值是`真正的`如果变量是分类。

VariableInfo还包括任何变量,不习惯适应模型作为预测或响应。

数据类型:表

`VariableNames`- - - - - -变量的名字
单元阵列的特征向量

这个属性是只读的。

变量的名字,指定为一个单元阵列的特征向量。

如果符合基于一个表或数据集,这个属性提供了表中的变量或数据集的名称。
如果适合基于预测矩阵和响应向量,VariableNames包含指定的值“VarNames”名称-值对参数的拟合方法。的默认值“VarNames”是{x1, x2,…,‘xn’,‘y’}。

VariableNames还包括任何变量,不习惯适应模型作为预测或响应。

数据类型:细胞

`变量`- - - - - -输入数据
表

这个属性是只读的。

输入数据,指定为一个表。变量包含预测和响应值。如果合适的数据集是基于一个表或数组,变量包含了所有的数据表或数据集的数组。否则,变量从输入数据矩阵表创建X和响应向量y。

变量还包括任何变量,不习惯适应模型作为预测或响应。

数据类型:表

对象的功能

全部展开

创建`CompactLinearModel`

紧凑的 紧凑的线性回归模型

添加或删除从线性模型

`addTerms`	添加条件线性回归模型
`removeTerms`	删除从线性回归模型
`一步`	通过添加或删除条款提高线性回归模型

预测的反应

`函数宏指令`	预测反应的线性回归模型使用一个输入为每个预测
`预测`	线性回归模型的预测的反应
`随机`	模拟反应线性回归模型的随机噪声

评估线性模型

`方差分析`	线性回归模型的方差分析
`coefCI`	线性回归模型的系数的置信区间估计
`coefTest`	在线性回归模型系数线性假设检验
`dwt`	Durbin-Watson测试与线性回归模型对象
`partialDependence`	计算部分依赖

可视化线性模型和汇总统计

`情节`	散点图或添加变量的线性回归模型
`plotAdded`	添加变量的线性回归模型
`plotAdjustedResponse`	调整响应的线性回归模型
`plotDiagnostics`	情节线性回归模型的观察诊断
`plotEffects`	情节在线性回归模型预测的主要影响
`plotInteraction`	情节交互作用的两个线性回归模型的预测
`plotPartialDependence`	创建部分依赖图(PDP)和个人条件期望(ICE)情节
`plotResiduals`	情节线性回归模型的残差
`plotSlice`	通过线性回归拟合曲面的情节片

收集线性模型的属性

`收集`	收集的属性统计和机器学习工具对象从GPU

例子

全部折叠

适合使用矩阵中的数据线性回归

打开生活的脚本

适合一个线性回归模型使用一个矩阵输入数据集。

加载carsmall数据集,一个矩阵的输入数据集。

负载carsmallX =(重量、马力、加速度);

通过使用线性回归模型fitlm。

mdl = fitlm (X,英里/加仑)

mdl =线性回归模型:y ~ 1 + x1 + x2 + x3估计系数:估计SE tStat pValue __________替__________(拦截)e-21 x1 -0.0065416 0.0011274 -5.8023 4.8957 47.977 3.8785 12.37 9.8742 e-08 x2 -0.042943 -0.011583 0.19333 -0.059913 0.95236 0.024313 -1.7663 0.08078 x3的观测数量:93年,错误自由度:89根均方误差:4.09平方:0.752,调整平方:0.744 f统计量与常数模型:90年,假定值= 7.38 e-27

模型显示包括模型公式,估计系数,和模型汇总统计。

在显示模型公式,y ~ 1 + x1 + x2 + x3,对应于 $y = β_{0} + β_{1} X_{1} + β_{2} X_{2} + β_{3} X_{3} + ϵ$ 。

模型还显示了估计的系数显示信息,存储在系数财产。显示系数财产。

mdl.Coefficients

ans =4×4表估计SE tStat pValue __________替__________(拦截)47.977 3.8785 12.37 4.8957 e-21 x1 -0.0065416 0.0011274 -5.8023 9.8742 e-08 x2 x3 -0.011583 0.19333 -0.059913 0.08078 -0.042943 0.024313 -1.7663 0.95236

的系数财产包括这些列:

估计——系数估计为每个模型中相应术语。例如,常数项的估计(拦截)是47.977。
SE-标准误差的系数。
tStat- - - - - -t统计每个系数测试零假设相应的系数是零对替代,它不同于零,鉴于其他预测模型。请注意,tStat =估计/ SE。例如,t统计的拦截是47.977/3.8785 = 12.37。
pValue- - - - - -p价值的t统计假设检验,相应的系数等于零。例如,p价值的t统计的x2大于0.05,所以这一项不是重要的在5%的显著性水平给定模型中的其他条款。

摘要统计模型是:

数量的观察——没有任何的行数南值。例如,数量的观察93年,因为英里/加仑数据向量有6个南价值和马力有一个数据向量南值不同的观察,行数的地方X和英里/加仑是100。
错误的自由度- - - - - -n- - - - - -p,在那里n是观测的数量,和p在模型中系数的数量,包括拦截。例如,模型有四个预测因子,所以错误的自由度是93 - 4 = 89。
根均方误差均方误差的平方根,估计误差分布的标准偏差。
平方和调整后的平方——确定和调整系数确定系数,分别。例如,平方值表明,模型解释了大约75%的变化响应变量英里/加仑。
f统计量与常数模型——测试数据F以及回归模型,哪些测试模型适合明显好于退化模型是否只有一个常数项组成。
假定值- - - - - -p价值的F以及在模型。例如,模型是重要的p7.3816 e-27的价值。

你可以找到这些数据模型属性(NumObservations,教育部,RMSE,Rsquared),并通过使用方差分析函数。

方差分析(mdl“摘要”)

ans =3×5表SumSq DF MeanSq F pValue ______ __交__________总92 65.269 4516 1505.3 89.987 7.3816 6004.8 e-27剩余1488.8 89 16.728

使用情节创建一个额外的变量情节(偏回归利用情节)对整个模型常数(拦截)项除外。

情节(mdl)

图包含一个坐标轴对象。坐标轴对象添加了标题变量情节为整体模型包含3线类型的对象。这些对象表示调整数据,适合:y = 0.0449564 * x, 95% conf.界限。

线性回归和分类预测

打开生活的脚本

适合包含分类预测的线性回归模型。重新排序的类别分类预测控制模型的参考电平。然后,用方差分析测试类别变量的意义。

模型的分类预测

加载carsmall数据集和创建一个线性回归模型英里/加仑的函数Model_Year。把数值向量Model_Year作为分类变量,确定预测使用“CategoricalVars”名称-值对的论点。

负载carsmallmdl = fitlm (Model_Year MPG,“CategoricalVars”,1“VarNames”,{“Model_Year”,“英里”})

mdl =线性回归模型:MPG ~ 1 + Model_Year估计系数:估计SE tStat pValue ________交__________(拦截)17.69 1.0328 17.127 3.2371 e-30 Model_Year_76 Model_Year_82 0.0069402 3.8839 1.4059 2.7625 14.02 1.4369 9.7571 8.2164 e-16数量的观察:94年,错误自由度:91根均方误差:5.56平方:0.531,调整平方:0.521 f统计量与常数模型:51.6,p = 1.07 e15汽油

在显示模型公式,英里/加仑~ 1 + Model_Year,对应于

$英里/加仑 = β_{0} + β_{1} Ι_{一年 = 76年} + β_{2} Ι_{一年 = 82年} + ϵ$ ,

在哪里 $Ι_{一年 = 76年}$ 和 $Ι_{一年 = 82年}$ 指标变量的值是一个如果的价值Model_Year分别是76年和82年。的Model_Year变量包括三个不同的值,您可以检查使用独特的函数。

独特的(Model_Year)

ans =3×170 76 82

fitlm选择最小的值Model_Year作为参考级别(“70”)并创建两个指标变量 $Ι_{一年 = 76年}$ 和 $Ι_{一年 = 82年}$ 。模型只包含两个指标变量,因为设计矩阵成为等级不足如果模型包括三个指标变量(每个级别)和截距项。

模型和完整的指标变量

你可以解释的模型公式mdl作为一个拥有三个指标变量的模型没有拦截的术语:

$y = β_{0} Ι_{x_{1} = 70年} + (β_{0} + β_{1}) Ι_{x_{1} = 76年} + ({β_{0} + β}_{2}) Ι_{x_{2} = 82年} + ϵ$ 。

或者,您可以创建一个拥有三个指标变量的模型没有截距项通过手动创建指标变量和指定模型公式。

temp_Year = dummyvar(分类(Model_Year));Model_Year_70 = temp_Year (: 1);Model_Year_76 = temp_Year (:, 2);Model_Year_82 = temp_Year (: 3);台=表(Model_Year_70 Model_Year_76、Model_Year_82 MPG);mdl = fitlm(资源描述,“MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82 - 1 ')

mdl =线性回归模型:MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82估计系数:估计SE tStat pValue ________ ________ _____ Model_Year_70 17.69 1.0328 17.127 3.2371 e-30 Model_Year_76 21.574 0.95387 22.617 4.0156 e-39 Model_Year_82 31.71 0.99896 31.743 5.2234 e-51数量的观察:94年,错误自由度:91根均方误差:5.56

选择参考水平模型

你可以选择一个参考水平通过修改订单在一个分类变量的类别。首先,创建一个分类变量一年。

年=分类(Model_Year);

检查使用的类别类别函数。

类别(年)

ans =3 x1细胞””{70}{76}{82 '}

如果你使用一年作为一个预测变量fitlm选择第一类“70”作为参考水平。重新排序一年通过使用reordercats函数。

Year_reordered = reordercats(一年,{“76”,“70”,“82”});类别(Year_reordered)

ans =3 x1细胞””{76}{70}{82 '}

第一类的Year_reordered是“76”。创建一个线性回归模型英里/加仑的函数Year_reordered。

mdl2 = fitlm (Year_reordered MPG,“VarNames”,{“Model_Year”,“英里”})

mdl2 =线性回归模型:MPG ~ 1 + Model_Year估计系数:估计SE tStat pValue ______和_____(拦截)21.574 0.95387 22.617 4.0156 e-39 Model_Year_70 Model_Year_82 0.0069402 -3.8839 1.4059 -2.7625 10.136 1.3812 7.3385 8.7634 e-11数量的观察:94年,错误自由度:91根均方误差:5.56平方:0.531,调整平方:0.521 f统计量与常数模型:51.6,p = 1.07 e15汽油

mdl2使用“76”作为参考水平,包括两个指标变量 $Ι_{一年 = 70年}$ 和 $Ι_{一年 = 82年}$ 。

评估分类预测

该模型显示mdl2包括一个p每一项的值来测试是否相应的系数等于零。每一个p值检查每一个指标变量。检查类别变量Model_Year作为一个群体的指标变量,使用方差分析。使用“组件”返回一个组件(默认)选项为每个变量方差分析表,包括方差分析统计模型中的常数项除外。

方差分析(mdl2“组件”)

ans =2×5表看上去SumSq DF MeanSq F pValue __得一样_____ __________ Model_Year 3190.1 - 2 2815.2 91 30.936 1595.1 51.56 1.0694 e15汽油错误

该组件包括方差分析表p价值的Model_Year变量,这是小于p值的指标变量。

健壮的线性回归模型

打开生活的脚本

加载哈尔德数据集的措施在其硬化水泥成分热的影响。

负载哈尔德

这个数据集包含的变量成分和热。矩阵成分包含四个化学物质的百分比组成的水泥。向量热包含的值为每个水泥样品加热硬化后180天。

一个健壮的线性回归模型的数据。

mdl = fitlm(成分、热、“RobustOpts”,“上”)

mdl =线性回归模型(健壮健康):y ~ 1 + x1 + x2 + x3 + x4估计系数:估计SE tStat pValue ________ _________说x1(拦截)60.09 75.818 0.79256 0.4509 1.5753 0.80585 1.9548 0.086346 x2 0.5322 0.78315 0.67957 0.51596 x3 x4 -0.12052 0.7672 -0.15709 0.87424 0.13346 0.8166 0.16343 0.87906的观测数量:13日误差自由度:8根均方误差:2.65平方:0.979,调整平方:0.969 f统计量与常数模型:94.6,p = 9.03 e-07

更多细节,请参见主题减少使用健壮的回归离群值的影响,比较健壮的结果符合标准最小二乘匹配。

适合使用逐步回归线性模型

打开生活的脚本

加载哈尔德数据集的措施在其硬化水泥成分热的影响。

负载哈尔德

这个数据集包含的变量成分和热。矩阵成分包含四个化学物质的百分比组成的水泥。向量热包含的值为每个水泥样品加热硬化后180天。

适合逐步线性回归模型的数据。指定标准的0.06作为阈值项添加到模型。

mdl = stepwiselm(成分、热、“囚禁”,0.06)

1。添加x4, FStat = 22.7985, pValue = 0.000576232 - 2。添加x1, FStat = 108.2239, pValue = 1.105281 e-06 3。添加x2, FStat = 5.0259, pValue = 0.051687 - 4。删除x4, FStat = 1.8633, pValue = 0.2054

mdl =线性回归模型:y ~ 1 + x1 + x2估计系数:估计SE tStat pValue说______ __________(拦截)52.577 2.2862 22.998 5.4566平台以及x1 e-07 x2 0.66225 0.045855 14.442 2.6922 1.4683 0.1213 12.105 5.029 e-08数量的观察:13日误差自由度:10根均方误差:2.41平方:0.979,调整平方:0.974 f统计量与常数模型:230年,假定值= 4.41 e-09

默认情况下,模型是一个常数模型开始。stepwiselm执行选择和添加x4,x1,x2(依次),因为相应的p值小于被关闭的值为0.06。stepwiselm然后使用落后的取消和删除x4从模型中,因为一次x2在模型中,p价值的x4大于的默认值吗PRemove0.1点。

选择功能

对高维数据集,减少了计算时间符合线性回归模型使用fitrlinear函数。
调整回归,使用fitrlinear,套索,脊,或plsregress。
- fitrlinear演化为高维数据集回归使用套索或岭回归。
- 套索删除冗余预测线性回归中使用套索或弹性。
- 脊使用岭回归演化回归与相关条款。
- plsregress演化使用偏最小二乘回归与相关条款。

扩展功能

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

使用笔记和限制:

的预测和随机代码生成功能支持。金宝app

有关更多信息,请参见介绍代码生成。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

使用笔记和限制:

以下对象函数完全支持GPU数组:金宝app
以下对象功能支持模型对象装有GPU数组输入参数:金宝app

有关更多信息,请参见运行在GPU MATLAB函数(并行计算工具箱)。

另请参阅

fitlm|stepwiselm|CompactLinearModel

主题

介绍了R2012a

LinearModel

描述

创建

属性

系数估计

CoefficientCovariance- - - - - -协方差矩阵的系数估计数字矩阵

CoefficientNames- - - - - -系数的名字单元阵列的特征向量

系数- - - - - -系数值表

NumCoefficients- - - - - -模型系数的数量正整数

NumEstimatedCoefficients- - - - - -数量的估计系数正整数

摘要统计信息

教育部- - - - - -自由度为错误正整数

诊断- - - - - -观察诊断表

安装- - - - - -根据输入数据拟合响应值数值向量

LogLikelihood- - - - - -Loglikelihood数值

ModelCriterion- - - - - -标准模型的比较结构

均方误差- - - - - -均方误差数值

残差- - - - - -残差拟合模型表

RMSE- - - - - -根均方误差数值

Rsquared- - - - - -平方值的模型结构

上交所- - - - - -的平方误差的总和数值

苏维埃社会主义共和国- - - - - -回归平方和数值

风场- - - - - -总平方和数值

拟合方法

健壮的- - - - - -健壮的健康信息结构

步骤- - - - - -分段拟合的信息结构

输入数据

公式- - - - - -模型信息LinearFormula对象

NumObservations- - - - - -数量的观察正整数

NumPredictors- - - - - -数量的预测变量正整数

NumVariables- - - - - -数量的变量正整数

ObservationInfo- - - - - -观测信息表

ObservationNames- - - - - -观察的名字单元阵列的特征向量

PredictorNames- - - - - -名字适合使用的预测模型单元阵列的特征向量

ResponseName- - - - - -响应变量名特征向量

VariableInfo- - - - - -信息变量表

VariableNames- - - - - -变量的名字单元阵列的特征向量

变量- - - - - -输入数据表

对象的功能

创建CompactLinearModel

添加或删除从线性模型

预测的反应

评估线性模型

可视化线性模型和汇总统计

收集线性模型的属性

例子

适合使用矩阵中的数据线性回归

线性回归和分类预测

健壮的线性回归模型

适合使用逐步回归线性模型

更多关于

计算矩阵

选择功能

扩展功能

C / c++代码生成生成C和c++代码使用MATLAB®编码器™。

GPU数组加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:一个循序渐进的指导与MATLAB

`CoefficientCovariance`- - - - - -协方差矩阵的系数估计
数字矩阵

`CoefficientNames`- - - - - -系数的名字
单元阵列的特征向量

`系数`- - - - - -系数值
表

`NumCoefficients`- - - - - -模型系数的数量
正整数

`NumEstimatedCoefficients`- - - - - -数量的估计系数
正整数

`教育部`- - - - - -自由度为错误
正整数

`诊断`- - - - - -观察诊断
表

`安装`- - - - - -根据输入数据拟合响应值
数值向量

`LogLikelihood`- - - - - -Loglikelihood
数值

`ModelCriterion`- - - - - -标准模型的比较
结构

`均方误差`- - - - - -均方误差
数值

`残差`- - - - - -残差拟合模型
表

`RMSE`- - - - - -根均方误差
数值

`Rsquared`- - - - - -平方值的模型
结构

`上交所`- - - - - -的平方误差的总和
数值

`苏维埃社会主义共和国`- - - - - -回归平方和
数值

`风场`- - - - - -总平方和
数值

`健壮的`- - - - - -健壮的健康信息
结构

`步骤`- - - - - -分段拟合的信息
结构

`公式`- - - - - -模型信息
`LinearFormula`对象

`NumObservations`- - - - - -数量的观察
正整数

`NumPredictors`- - - - - -数量的预测变量
正整数

`NumVariables`- - - - - -数量的变量
正整数

`ObservationInfo`- - - - - -观测信息
表

`ObservationNames`- - - - - -观察的名字
单元阵列的特征向量

`PredictorNames`- - - - - -名字适合使用的预测模型
单元阵列的特征向量

`ResponseName`- - - - - -响应变量名
特征向量

`VariableInfo`- - - - - -信息变量
表

`VariableNames`- - - - - -变量的名字
单元阵列的特征向量

`变量`- - - - - -输入数据
表

创建`CompactLinearModel`

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

GPU数组
加速代码运行在一个图形处理单元(GPU)使用并行计算工具箱™。