线性回归模型
LinearModel
拟合线性回归模型对象。一个回归模型描述了反应和预测之间的关系。线性回归模型的线性是指的线性预测系数。
使用的属性LinearModel
对象调查合身的线性回归模型。对象属性包括系数估计信息,汇总统计,拟合方法,输入数据。使用对象函数预测反应和修改,评估,想象的线性回归模型。
创建一个LinearModel
对象的使用fitlm
或stepwiselm
。
fitlm
符合数据线性回归模型使用一个固定的模型规范。使用addTerms
,removeTerms
,或一步
从模型中添加或删除条款。另外,使用stepwiselm
适合用逐步线性回归模型。
CoefficientCovariance
- - - - - -协方差矩阵的系数估计CoefficientNames
- - - - - -系数的名字这个属性是只读的。
系数名称指定为一个单元阵列的特征向量,每个包含的名称对应的词。
数据类型:细胞
系数
- - - - - -系数值这个属性是只读的。
系数值,指定为一个表。系数
为每个系数和这些列包含一行:
估计
——估计系数值
SE
-标准误差的估计
tStat
- - - - - -t统计测试系数为零
pValue
- - - - - -p价值的t统计
使用方差分析
(只对一个线性回归模型)或coefTest
执行其他测试的系数。使用coefCI
找到系数估计的置信区间。
获得这些列向量,索引属性使用点符号。例如,获得的估计系数向量模型mdl
:
β= mdl.Coefficients.Estimate
数据类型:表
NumCoefficients
- - - - - -模型系数的数量这个属性是只读的。
数量的模型系数,指定为一个正整数。NumCoefficients
包括系数设置为0,当模型方面的不足。
数据类型:双
NumEstimatedCoefficients
- - - - - -数量的估计系数这个属性是只读的。
数量的估计系数模型,指定为一个正整数。NumEstimatedCoefficients
不包括系数设置为0,当模型方面的不足。NumEstimatedCoefficients
是回归的自由度。
数据类型:双
教育部
- - - - - -自由度为错误这个属性是只读的。
自由度的误差(残差),等于观测的数量减去估计系数的数量,指定为一个正整数。
数据类型:双
诊断
- - - - - -观察诊断这个属性是只读的。
观察诊断,指定为一个表,其中包含为每个观察一行和列在这个表中描述。
列 | 意义 | 描述 |
---|---|---|
利用 |
对角元素的HatMatrix |
利用 为每个观测表明在多大程度上是由观察到的预测价值。一个值接近1 表明,在很大程度上取决于正观察,从其他观察几乎没有贡献。一个值接近0 表明,适合在很大程度上取决于另一个观察。对于一个模型P 系数和N 观察,平均价值利用 是P / N 。一个利用 值大于2 * P / N 表明高杠杆。 |
CooksDistance |
库克的距离 | CooksDistance 是一个按比例缩小的拟合值的变化。一个观察CooksDistance 大于三倍的意思是库克的距离可以是一个局外人。 |
Dffits |
Delete-1拟合值的差异 | Dffits 是按比例缩小的变化拟合值为每个观测,观测的结果不包括健康。值大于2 *倍根号(P / N) 在绝对值可以被认为是有影响力的。 |
S2_i |
Delete-1方差 | S2_i 是一组依次删除每个观测获得的剩余方差估计。这些估计可以与均方误差(MSE)值,存储在均方误差 财产。 |
CovRatio |
Delete-1协方差的比率决定因素 | CovRatio 的比值系数的协方差矩阵的行列式,每次观察删除反过来,协方差矩阵的行列式的完整模型。值大于1 + 3 * P / N 或小于1 - 3 * P / N 表明有影响力的点。 |
Dfbetas |
Delete-1比例系数估计的差异 | Dfbetas 是一个N ——- - - - - -P 系数矩阵的扩展变化估计依次扣除每个观测的结果。值大于3 /√(N) 在绝对值表明,观察相应的系数有很大的影响。 |
HatMatrix |
投影矩阵计算安装 从观察到的响应 |
HatMatrix 是一个N ——- - - - - -N 矩阵,安装= HatMatrix * Y ,在那里Y 响应向量和吗安装 是拟合响应值的向量。 |
诊断
包含的信息有助于发现异常值和影响力的观察。Delete-1诊断捕捉变化,结果从依次扣除每个观察健康。更多细节,请参阅帽子矩阵和杠杆,库克的距离,Delete-1统计。
使用plotDiagnostics
绘制观察诊断。
行中使用不适合,因为(在缺失值ObservationInfo.Missing
(在)或排除值ObservationInfo.Excluded
)包含南
中的值CooksDistance
,Dffits
,S2_i
,CovRatio
列和0利用
,Dfbetas
,HatMatrix
列。
获得这些列作为一个数组,索引属性使用点符号。例如,获得delete-1方差向量模型中mdl
:
S2i = mdl.Diagnostics.S2_i;
数据类型:表
安装
- - - - - -根据输入数据拟合响应值LogLikelihood
- - - - - -Loglikelihood这个属性是只读的。
Loglikelihood响应值,指定为一个数字值,基于假设每个响应值遵循正态分布。正态分布的均值安装(预测)响应值和方差均方误差
。
数据类型:单
|双
ModelCriterion
- - - - - -标准模型的比较这个属性是只读的。
标准模型比较,与这些字段指定为一个结构:
另类投资会议
——Akaike信息标准。AIC = 2 * logL + 2 * m
,在那里logL
loglikelihood和米
是估计的数量参数。
AICc
——Akaike信息标准样本大小的修正。AICc = AIC + (2 * m * (m + 1) / (n - m - 1)
,在那里n
是观测的数量。
BIC
——贝叶斯信息准则。BIC = 2 * logL + m * log (n)
。
中安集团经贸
——Akaike信息准则一致。中安集团经贸= 2 * logL + m * (log (n) + 1)
。
信息标准模型选择工具,您可以使用多个模型比较适合相同的数据。这些标准是基于可能性模型适合的措施,包括惩罚复杂性(具体来说,参数的个数)。不同的信息形式的处罚标准是有区别的。
当你比较多个模型,模型信息准则值最低的最佳拟合模型。最佳拟合模型取决于使用的标准模型的比较。
获得的任何准则值作为一个标量,索引属性使用点符号。例如,获得AIC值另类投资会议
在模型中mdl
:
aic = mdl.ModelCriterion.AIC
数据类型:结构体
均方误差
- - - - - -均方误差这个属性是只读的。
均方误差(残差),指定为一个数值。
均方误差=上交所/教育部,
在哪里均方误差均方误差,上交所是平方误差的总和,教育部的自由度。
数据类型:单
|双
残差
- - - - - -残差拟合模型这个属性是只读的。
残差拟合模型,指定为一个表,其中包含为每个观察一行和列在这个表中描述。
列 | 描述 |
---|---|
生 |
观察-拟合值 |
皮尔森 |
原始残差除以根均方误差(RMSE) |
标准化 |
原始残差除以他们估计的标准偏差 |
Studentized |
生残余除以一个独立的剩余标准差的估计。剩余的观察我除以估计误差标准差基于观察除了观察吗我。 |
使用plotResiduals
创建一个残差的情节。有关详细信息,请参见残差。
行中使用不适合,因为(在缺失值ObservationInfo.Missing
(在)或排除值ObservationInfo.Excluded
)包含南
值。
获得这些列向量,索引属性使用点符号。例如,获得原始残余向量r
在模型中mdl
:
r = mdl.Residuals.Raw
数据类型:表
RMSE
- - - - - -根均方误差这个属性是只读的。
根均方误差(残差),指定为一个数值。
RMSE=√均方误差),
在哪里RMSE根均方误差和吗均方误差均方误差。
数据类型:单
|双
Rsquared
- - - - - -平方值的模型这个属性是只读的。
平方值的模型,用两个字段指定为一个结构:
普通的
——普通(调整)的平方
调整
——平方调整系数的数量
平方值的比例是总平方和的解释模型。普通的平方值之间的关系苏维埃社会主义共和国
和风场
属性:
Rsquared = SSR /风场
,
在哪里风场
是总平方和,苏维埃社会主义共和国
回归平方和。
有关详细信息,请参见确定系数(平方)。
获得这些值作为一个标量,索引属性使用点符号。例如,在模型中获得调整的平方值mdl
:
r2 = mdl.Rsquared.Adjusted
数据类型:结构体
上交所
- - - - - -的平方误差的总和这个属性是只读的。
平方误差的总和(残差),指定为一个数值。
勾股定理意味着
海温= SSE + SSR
,
在哪里风场
是总平方和,上交所
是平方误差的总和,苏维埃社会主义共和国
回归平方和。
数据类型:单
|双
苏维埃社会主义共和国
- - - - - -回归平方和这个属性是只读的。
回归平方和,指定为一个数值。回归平方和等于偏差的平方和的拟合值的意思。
勾股定理意味着
海温= SSE + SSR
,
在哪里风场
是总平方和,上交所
是平方误差的总和,苏维埃社会主义共和国
回归平方和。
数据类型:单
|双
风场
- - - - - -总平方和这个属性是只读的。
总平方和,指定为一个数值。总平方和等于响应向量的偏差的平方和y
从意思是(y)
。
勾股定理意味着
海温= SSE + SSR
,
在哪里风场
是总平方和,上交所
是平方误差的总和,苏维埃社会主义共和国
回归平方和。
数据类型:单
|双
健壮的
- - - - - -健壮的健康信息这个属性是只读的。
健壮的健康信息,指定为一个结构与此表中描述的领域。
场 | 描述 |
---|---|
WgtFun |
健壮的权重函数,比如“bisquare” (见“RobustOpts” ) |
调优 |
调优常数。这个字段是空的([] )如果WgtFun 是“ols” 或者,如果WgtFun 是一个自定义的函数处理加权函数使用默认调优常数1。 |
权重 |
在决赛中使用的权重向量迭代强劲的健康。这个字段是空的CompactLinearModel 对象。 |
这个结构是空的,除非你适合使用健壮的回归模型。
数据类型:结构体
步骤
- - - - - -分段拟合的信息这个属性是只读的。
分段拟合信息,指定为这个表结构描述的领域。
场 | 描述 |
---|---|
开始 |
代表起始模型公式 |
较低的 |
代表下界公式模型。的条款较低的 在模型中必须保持。 |
上 |
代表上限公式模型。该模型不能包含更多的比上 。 |
标准 |
标准用于分段算法,如上交所的 |
被关闭的 |
阈值标准 添加一个术语 |
PRemove |
阈值标准 删除一个术语 |
历史 |
表代表中所需要的步骤 |
的历史
每一步的表包含一行,包括最初的适应,和列在这个表中描述。
列 | 描述 |
---|---|
行动 |
期间的行动步骤:
|
TermName |
|
条款 |
模型规范的计算矩阵 |
DF |
回归后的自由度的一步 |
delDF |
上一步回归自由度变化的步骤删除一个术语(负) |
异常 |
异常(剩余平方和)步骤(只对广义线性回归模型) |
函数 |
F统计这导致了一步 |
PValue |
p价值的F统计 |
结构是空的,除非你适合使用逐步回归模型。
数据类型:结构体
公式
- - - - - -模型信息LinearFormula
对象这个属性是只读的。
模型信息,指定为一个LinearFormula
对象。
显示的公式拟合模型mdl
使用点符号:
mdl.Formula
NumObservations
- - - - - -数量的观察这个属性是只读的。
数用于拟合观测数据的拟合函数,指定为一个正整数。NumObservations
是观测的数量提供原始表,数据集,或矩阵,减去任何排除行(设置的“排除”
名称-值对参数)或具有缺失值的行。
数据类型:双
NumPredictors
- - - - - -数量的预测变量这个属性是只读的。
以适应模型,使用数量的预测变量指定为一个正整数。
数据类型:双
NumVariables
- - - - - -数量的变量这个属性是只读的。
输入数据的变量数量,指定为一个正整数。NumVariables
是变量的数量在原始表或数据集,或预测矩阵中的列的总数和响应向量。
NumVariables
还包括任何变量,不习惯适应模型作为预测或响应。
数据类型:双
ObservationInfo
- - - - - -观测信息这个属性是只读的。
观察信息,指定为一个n表4,n等于输入数据的行数。ObservationInfo
包含这个表中描述的列。
列 | 描述 |
---|---|
权重 |
观察体重、指定为一个数值。默认值是1 。 |
被排除在外 |
的指标排除观察,指定为一个逻辑值。这个值是真正的 如果你观察排除在适合使用“排除” 名称-值对的论点。 |
失踪 |
失踪的观察指标,指定为一个逻辑值。这个值是真正的 如果观察失踪。 |
子集 |
指标的拟合函数是否使用观察,指定为一个逻辑值。这个值是真正的 如果观察不排除或失踪,这意味着观察拟合函数使用。 |
获得这些列向量,索引属性使用点符号。例如,获取权向量w
模型的mdl
:
w = mdl.ObservationInfo.Weights
数据类型:表
ObservationNames
- - - - - -观察的名字这个属性是只读的。
观察名称指定为特征向量的单元阵列包含观测中使用的名称。
如果符合基于一个表或包含观测数据集名称,ObservationNames
使用这些名称。
否则,ObservationNames
是一个空单元数组。
数据类型:细胞
PredictorNames
- - - - - -名字适合使用的预测模型这个属性是只读的。
名字适合使用的预测模型,指定为一个单元阵列的特征向量。
数据类型:细胞
ResponseName
- - - - - -响应变量名这个属性是只读的。
响应变量名称,指定为一个特征向量。
数据类型:字符
VariableInfo
- - - - - -信息变量这个属性是只读的。
变量中包含的信息变量
,指定为一个表为每个变量与一行和列在这个表中描述。
列 | 描述 |
---|---|
类 |
变量类,指定为一个单元阵列的特征向量,如“双” 和“分类” |
范围 |
变量范围,指定为一个单元阵列的向量
|
InModel |
的指标变量的拟合模型,指定为一个逻辑向量。这个值是真正的 如果模型包括变量。 |
IsCategorical |
指标的分类变量指定为一个逻辑向量。这个值是真正的 如果变量是分类。 |
VariableInfo
还包括任何变量,不习惯适应模型作为预测或响应。
数据类型:表
VariableNames
- - - - - -变量的名字这个属性是只读的。
变量的名字,指定为一个单元阵列的特征向量。
如果符合基于一个表或数据集,这个属性提供了表中的变量或数据集的名称。
如果适合基于预测矩阵和响应向量,VariableNames
包含指定的值“VarNames”
名称-值对参数的拟合方法。的默认值“VarNames”
是{x1, x2,…,‘xn’,‘y’}
。
VariableNames
还包括任何变量,不习惯适应模型作为预测或响应。
数据类型:细胞
变量
- - - - - -输入数据这个属性是只读的。
输入数据,指定为一个表。变量
包含预测和响应值。如果合适的数据集是基于一个表或数组,变量
包含了所有的数据表或数据集的数组。否则,变量
从输入数据矩阵表创建X
和响应向量y
。
变量
还包括任何变量,不习惯适应模型作为预测或响应。
数据类型:表
CompactLinearModel
紧凑的 |
紧凑的线性回归模型 |
addTerms |
添加条件线性回归模型 |
removeTerms |
删除从线性回归模型 |
一步 |
通过添加或删除条款提高线性回归模型 |
方差分析 |
线性回归模型的方差分析 |
coefCI |
线性回归模型的系数的置信区间估计 |
coefTest |
在线性回归模型系数线性假设检验 |
dwt |
Durbin-Watson测试与线性回归模型对象 |
partialDependence |
计算部分依赖 |
情节 |
散点图或添加变量的线性回归模型 |
plotAdded |
添加变量的线性回归模型 |
plotAdjustedResponse |
调整响应的线性回归模型 |
plotDiagnostics |
情节线性回归模型的观察诊断 |
plotEffects |
情节在线性回归模型预测的主要影响 |
plotInteraction |
情节交互作用的两个线性回归模型的预测 |
plotPartialDependence |
创建部分依赖图(PDP)和个人条件期望(ICE)情节 |
plotResiduals |
情节线性回归模型的残差 |
plotSlice |
通过线性回归拟合曲面的情节片 |
收集 |
收集的属性统计和机器学习工具对象从GPU |
适合一个线性回归模型使用一个矩阵输入数据集。
加载carsmall
数据集,一个矩阵的输入数据集。
负载carsmallX =(重量、马力、加速度);
通过使用线性回归模型fitlm
。
mdl = fitlm (X,英里/加仑)
mdl =线性回归模型:y ~ 1 + x1 + x2 + x3估计系数:估计SE tStat pValue __________替__________(拦截)e-21 x1 -0.0065416 0.0011274 -5.8023 4.8957 47.977 3.8785 12.37 9.8742 e-08 x2 -0.042943 -0.011583 0.19333 -0.059913 0.95236 0.024313 -1.7663 0.08078 x3的观测数量:93年,错误自由度:89根均方误差:4.09平方:0.752,调整平方:0.744 f统计量与常数模型:90年,假定值= 7.38 e-27
模型显示包括模型公式,估计系数,和模型汇总统计。
在显示模型公式,y ~ 1 + x1 + x2 + x3
,对应于
。
模型还显示了估计的系数显示信息,存储在系数
财产。显示系数
财产。
mdl.Coefficients
ans =4×4表估计SE tStat pValue __________替__________(拦截)47.977 3.8785 12.37 4.8957 e-21 x1 -0.0065416 0.0011274 -5.8023 9.8742 e-08 x2 x3 -0.011583 0.19333 -0.059913 0.08078 -0.042943 0.024313 -1.7663 0.95236
的系数
财产包括这些列:
估计
——系数估计为每个模型中相应术语。例如,常数项的估计(拦截
)是47.977。
SE
-标准误差的系数。
tStat
- - - - - -t统计每个系数测试零假设相应的系数是零对替代,它不同于零,鉴于其他预测模型。请注意,tStat =估计/ SE
。例如,t统计的拦截是47.977/3.8785 = 12.37。
pValue
- - - - - -p价值的t统计假设检验,相应的系数等于零。例如,p价值的t统计的x2
大于0.05,所以这一项不是重要的在5%的显著性水平给定模型中的其他条款。
摘要统计模型是:
数量的观察
——没有任何的行数南
值。例如,数量的观察
93年,因为英里/加仑
数据向量有6个南
价值和马力
有一个数据向量南
值不同的观察,行数的地方X
和英里/加仑
是100。
错误的自由度
- - - - - -n- - - - - -p,在那里n是观测的数量,和p在模型中系数的数量,包括拦截。例如,模型有四个预测因子,所以错误的自由度
是93 - 4 = 89。
根均方误差
均方误差的平方根,估计误差分布的标准偏差。
平方
和调整后的平方
——确定和调整系数确定系数,分别。例如,平方
值表明,模型解释了大约75%的变化响应变量英里/加仑
。
f统计量与常数模型
——测试数据F以及回归模型,哪些测试模型适合明显好于退化模型是否只有一个常数项组成。
假定值
- - - - - -p价值的F以及在模型。例如,模型是重要的p7.3816 e-27的价值。
你可以找到这些数据模型属性(NumObservations
,教育部
,RMSE
,Rsquared
),并通过使用方差分析
函数。
方差分析(mdl“摘要”)
ans =3×5表SumSq DF MeanSq F pValue ______ __交__________总92 65.269 4516 1505.3 89.987 7.3816 6004.8 e-27剩余1488.8 89 16.728
使用情节
创建一个额外的变量情节(偏回归利用情节)对整个模型常数(拦截)项除外。
情节(mdl)
适合包含分类预测的线性回归模型。重新排序的类别分类预测控制模型的参考电平。然后,用方差分析
测试类别变量的意义。
模型的分类预测
加载carsmall
数据集和创建一个线性回归模型英里/加仑
的函数Model_Year
。把数值向量Model_Year
作为分类变量,确定预测使用“CategoricalVars”
名称-值对的论点。
负载carsmallmdl = fitlm (Model_Year MPG,“CategoricalVars”,1“VarNames”,{“Model_Year”,“英里”})
mdl =线性回归模型:MPG ~ 1 + Model_Year估计系数:估计SE tStat pValue ________交__________(拦截)17.69 1.0328 17.127 3.2371 e-30 Model_Year_76 Model_Year_82 0.0069402 3.8839 1.4059 2.7625 14.02 1.4369 9.7571 8.2164 e-16数量的观察:94年,错误自由度:91根均方误差:5.56平方:0.531,调整平方:0.521 f统计量与常数模型:51.6,p = 1.07 e15汽油
在显示模型公式,英里/加仑~ 1 + Model_Year
,对应于
,
在哪里
和
指标变量的值是一个如果的价值Model_Year
分别是76年和82年。的Model_Year
变量包括三个不同的值,您可以检查使用独特的
函数。
独特的(Model_Year)
ans =3×170 76 82
fitlm
选择最小的值Model_Year
作为参考级别(“70”
)并创建两个指标变量
和
。模型只包含两个指标变量,因为设计矩阵成为等级不足如果模型包括三个指标变量(每个级别)和截距项。
模型和完整的指标变量
你可以解释的模型公式mdl
作为一个拥有三个指标变量的模型没有拦截的术语:
。
或者,您可以创建一个拥有三个指标变量的模型没有截距项通过手动创建指标变量和指定模型公式。
temp_Year = dummyvar(分类(Model_Year));Model_Year_70 = temp_Year (: 1);Model_Year_76 = temp_Year (:, 2);Model_Year_82 = temp_Year (: 3);台=表(Model_Year_70 Model_Year_76、Model_Year_82 MPG);mdl = fitlm(资源描述,“MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82 - 1 ')
mdl =线性回归模型:MPG ~ Model_Year_70 + Model_Year_76 + Model_Year_82估计系数:估计SE tStat pValue ________ ________ _____ Model_Year_70 17.69 1.0328 17.127 3.2371 e-30 Model_Year_76 21.574 0.95387 22.617 4.0156 e-39 Model_Year_82 31.71 0.99896 31.743 5.2234 e-51数量的观察:94年,错误自由度:91根均方误差:5.56
选择参考水平模型
你可以选择一个参考水平通过修改订单在一个分类变量的类别。首先,创建一个分类变量一年
。
年=分类(Model_Year);
检查使用的类别类别
函数。
类别(年)
ans =3 x1细胞””{70}{76}{82 '}
如果你使用一年
作为一个预测变量fitlm
选择第一类“70”
作为参考水平。重新排序一年
通过使用reordercats
函数。
Year_reordered = reordercats(一年,{“76”,“70”,“82”});类别(Year_reordered)
ans =3 x1细胞””{76}{70}{82 '}
第一类的Year_reordered
是“76”
。创建一个线性回归模型英里/加仑
的函数Year_reordered
。
mdl2 = fitlm (Year_reordered MPG,“VarNames”,{“Model_Year”,“英里”})
mdl2 =线性回归模型:MPG ~ 1 + Model_Year估计系数:估计SE tStat pValue ______和_____(拦截)21.574 0.95387 22.617 4.0156 e-39 Model_Year_70 Model_Year_82 0.0069402 -3.8839 1.4059 -2.7625 10.136 1.3812 7.3385 8.7634 e-11数量的观察:94年,错误自由度:91根均方误差:5.56平方:0.531,调整平方:0.521 f统计量与常数模型:51.6,p = 1.07 e15汽油
mdl2
使用“76”
作为参考水平,包括两个指标变量
和
。
评估分类预测
该模型显示mdl2
包括一个p每一项的值来测试是否相应的系数等于零。每一个p值检查每一个指标变量。检查类别变量Model_Year
作为一个群体的指标变量,使用方差分析
。使用“组件”
返回一个组件(默认)选项为每个变量方差分析表,包括方差分析统计模型中的常数项除外。
方差分析(mdl2“组件”)
ans =2×5表看上去SumSq DF MeanSq F pValue __得一样_____ __________ Model_Year 3190.1 - 2 2815.2 91 30.936 1595.1 51.56 1.0694 e15汽油错误
该组件包括方差分析表p价值的Model_Year
变量,这是小于p值的指标变量。
加载哈尔德
数据集的措施在其硬化水泥成分热的影响。
负载哈尔德
这个数据集包含的变量成分
和热
。矩阵成分
包含四个化学物质的百分比组成的水泥。向量热
包含的值为每个水泥样品加热硬化后180天。
一个健壮的线性回归模型的数据。
mdl = fitlm(成分、热、“RobustOpts”,“上”)
mdl =线性回归模型(健壮健康):y ~ 1 + x1 + x2 + x3 + x4估计系数:估计SE tStat pValue ________ _________说x1(拦截)60.09 75.818 0.79256 0.4509 1.5753 0.80585 1.9548 0.086346 x2 0.5322 0.78315 0.67957 0.51596 x3 x4 -0.12052 0.7672 -0.15709 0.87424 0.13346 0.8166 0.16343 0.87906的观测数量:13日误差自由度:8根均方误差:2.65平方:0.979,调整平方:0.969 f统计量与常数模型:94.6,p = 9.03 e-07
更多细节,请参见主题减少使用健壮的回归离群值的影响,比较健壮的结果符合标准最小二乘匹配。
加载哈尔德
数据集的措施在其硬化水泥成分热的影响。
负载哈尔德
这个数据集包含的变量成分
和热
。矩阵成分
包含四个化学物质的百分比组成的水泥。向量热
包含的值为每个水泥样品加热硬化后180天。
适合逐步线性回归模型的数据。指定标准的0.06作为阈值项添加到模型。
mdl = stepwiselm(成分、热、“囚禁”,0.06)
1。添加x4, FStat = 22.7985, pValue = 0.000576232 - 2。添加x1, FStat = 108.2239, pValue = 1.105281 e-06 3。添加x2, FStat = 5.0259, pValue = 0.051687 - 4。删除x4, FStat = 1.8633, pValue = 0.2054
mdl =线性回归模型:y ~ 1 + x1 + x2估计系数:估计SE tStat pValue说______ __________(拦截)52.577 2.2862 22.998 5.4566平台以及x1 e-07 x2 0.66225 0.045855 14.442 2.6922 1.4683 0.1213 12.105 5.029 e-08数量的观察:13日误差自由度:10根均方误差:2.41平方:0.979,调整平方:0.974 f统计量与常数模型:230年,假定值= 4.41 e-09
默认情况下,模型是一个常数模型开始。stepwiselm
执行选择和添加x4
,x1
,x2
(依次),因为相应的p值小于被关闭的
值为0.06。stepwiselm
然后使用落后的取消和删除x4
从模型中,因为一次x2
在模型中,p价值的x4
大于的默认值吗PRemove
0.1点。
一个条件矩阵T
是一个t————(p+ 1)矩阵指定术语在一个模型中,在那里t术语的数量,p预测变量的数量,+ 1占响应变量。的价值T (i, j)
是变量的指数吗j
在术语我
。
例如,假设一个输入包括三个预测变量x1
,x2
,x3
和响应变量y
的顺序x1
,x2
,x3
,y
。每一行的T
代表一个术语:
[0 0 0 0]
——常数项或拦截
[0 1 0 0]
- - - - - -x2
;同样,x1 ^ 0 * x2 ^ 1 * x3 ^ 0
(1 0 1 0)
- - - - - -x1 * x3
(2 0 0 0)
- - - - - -x1 ^ 2
[0 1 2 0]
- - - - - -x2 * (x3 ^ 2)
的0
的每一项代表了响应变量。一般来说,一个列向量的零矩阵代表反应变量的位置。如果你有预测和响应变量在一个矩阵列向量,然后你必须包括0
为响应变量在每一行的最后一列。
对高维数据集,减少了计算时间符合线性回归模型使用fitrlinear
函数。
调整回归,使用fitrlinear
,套索
,脊
,或plsregress
。
fitrlinear
演化为高维数据集回归使用套索或岭回归。
套索
删除冗余预测线性回归中使用套索或弹性。
脊
使用岭回归演化回归与相关条款。
plsregress
演化使用偏最小二乘回归与相关条款。
你点击一个链接对应MATLAB命令:
运行该命令通过输入MATLAB命令窗口。Web浏览器不支持MATLAB命令。金宝app
你也可以从下面的列表中选择一个网站:
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。