主要内容

collintest

Belsley共线性诊断

描述

例子

collintest (X)显示Belsley共线性诊断用于评估矩阵或表中各变量共线性的强度和来源X在命令行。

例子

collintest (X名称,值)使用由一个或多个名称-值对参数指定的附加选项。例如,collintest (X,“阴谋”,“上”)将结果绘制成图形。

例子

sValue= collintest (___)返回奇异值使用前面语法中的任何输入参数组合按递减顺序排列。

sValuecondIdxVarDecomp) = collintest (___)此外返回条件指数方差分解比例

collintest (斧头___)在指定的坐标轴上绘图斧头而不是当前的轴(gca).斧头可以放在前面语法中的任何输入参数组合的前面。

sValuecondIdxVarDecomph) = collintest (___)另外,返回绘制图形对象的句柄。使用的元素h在创建绘图后修改它的属性。

例子

全部折叠

显示多个时间序列的共线性诊断。

加拿大通货膨胀和利率负荷数据。

负载Data_Canada

使用所有默认选项显示Belsley共线性诊断。

collintest(数据表)
方差分解sValue condIdx INF_C INF_G INT_S INT_M INT_L  --------------------------------------------------------- 2.1748 - 1 0.0012 0.0018 0.0003 0.0000 0.0001 0.4789 4.5413 0.0261 0.0806 0.0035 0.0006 0.0012 0.1602 13.5795 0.3386 0.3802 0.0811 0.0011 0.0137 0.1211 17.9617 0.6138 0.5276 0.1918 0.0004 0.0193 0.0248 87.8245 0.0202 0.00990.7233 0.9979 0.9658

只有显示的最后一行的条件索引大于默认容忍值30。在这一行中,最后三个变量(在最后三列中)的方差分解比例超过了默认容忍值0.5。这表明变量INT_SINT_M,INT_L表现出多重共线性。

绘制多个时间序列的共线性诊断。

加拿大通货膨胀和利率负荷数据。

负载Data_Canada

图的Belsley共线性诊断使用情节选择。

collintest(数据表,“阴谋”“上”)
方差分解sValue condIdx INF_C INF_G INT_S INT_M INT_L  --------------------------------------------------------- 2.1748 - 1 0.0012 0.0018 0.0003 0.0000 0.0001 0.4789 4.5413 0.0261 0.0806 0.0035 0.0006 0.0012 0.1602 13.5795 0.3386 0.3802 0.0811 0.0011 0.0137 0.1211 17.9617 0.6138 0.5276 0.1918 0.0004 0.0193 0.0248 87.8245 0.0202 0.00990.7233 0.9979 0.9658

图中包含一个轴对象。具有标题空白H i g H空白i d e x空白V r in c e空白d o s it o s的轴对象包含3个类型线的对象。这些对象代表了condIdx 87.8, tolProp。

该图对应于方差分解比例的最后一行的值,这是唯一一个条件指数大于默认容忍值30的值。这一行中的最后三个变量的方差分解比例超过了默认容忍值0.5,在图中用红色标记表示。

计算多个时间序列的共线性诊断,并返回奇异值、条件指数和方差分解比例。

加拿大通货膨胀和利率负荷数据。

负载Data_Canada

计算Belsley共线性诊断。关闭结果显示使用显示选择。

[sv, conIdx varDecomp] = collintest(数据表,“显示”...“关闭”);

没有显示结果。

显示varDecomp

varDecomp
varDecomp =5×50.0012 0.0018 0.0003 0.0000 0.0001 0.0261 0.0806 0.0035 0.0006 0.0012 0.3386 0.3802 0.0811 0.0011 0.0137 0.6138 0.5276 0.1918 0.0004 0.0193 0.0202 0.0099 0.7233 0.9979 0.9658

输出参数varDecomp是方差分解比例矩阵。sv一个向量的奇异值是降序排列的吗condIdx是条件索引的升序向量。

输入参数

全部折叠

输入回归变量,指定为numObs——- - - - - -numVars数字矩阵或表格数组。每一列的X对应一个变量,每一行对应一个观察值。对于具有截距的模型,X应该包含一列1。

collintest按比例划分X加工前的单位长度。数据X不应居中。

如果X是表格数组,则变量必须为数字。

数据类型:|表格

用于绘图的轴,指定为对象。

默认情况下,collintest绘制到当前坐标轴(gca).

名称-值参数

指定可选的逗号分隔的对名称,值参数。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家

例子:“阴谋”,“上”、“tolIdx”,35显示公差指数为35的结果图

在结果的显示和绘图中使用的变量名,指定为逗号分隔的对,由“varNames”一个单元向量或者字符串向量。varNames一定的长度numVars,每个单元格对应一个变量名。如果有截距项,那么varNames必须包括截距术语(例如,包括名称“常量”).该软件将所有变量名截断为前5个字符。

  • 如果X是一个矩阵,那么默认值是varNames单元格向量是字符串吗{‘var1’,‘var2’,…}

  • 如果X是一个表格数组,则默认值为varNames是房地产X.Properties.VariableNames

例子:varNames,{“常量”、“年龄”、“bdd”}

数据类型:细胞|字符串

Display results指示是否在命令窗口中显示结果,由逗号分隔的对组成“显示”其中一个“上”“关闭”.如果指定值“上”,则所有输出均以表格形式显示。

例子:“显示”,“关闭”

数据类型:细胞|字符串

标绘结果指示符表示是否标绘结果,指定为逗号分隔对组成“阴谋”其中一个“上”“关闭”

  • 如果指定值“上”,然后该图显示输出的关键行VarDecomp,也就是,这些行条件指数超过输入公差tolIdx

  • 如果一组临界行中至少有两个变量方差分解比例超过输入公差tolProp,然后用红色标记来识别这组人。

例子:“阴谋”,“上”

数据类型:细胞|字符串

条件索引公差,指定为逗号分隔对,由“tolIdx”且标量值至少为1。collintest使用容差来决定哪些索引大到足以推断数据中的近似依赖关系。的tolIdx取值仅在情节的值“上”

例子:“tolIdx”,25岁

数据类型:

方差分解比例公差,指定为逗号分隔对组成“tolProp”和0到1之间的标量。collintest使用容忍度来决定在任何近似依赖项中涉及哪些变量。的tolProp取值仅在情节的值“上”

例子:“tolProp”,0.4

数据类型:

输出参数

全部折叠

奇异值按比例缩小的X,返回为向量。的元素sValue是按降序排列的。

条件指数,返回一个元素按升序排列的向量。所有条件索引的值都在1和条件数按比例缩小的X.大索引标识变量之间的近似依赖关系X.指标的大小是衡量依赖关系与共线性关系有多接近的指标。

方差分解比例,返回为numVars——- - - - - -numVars矩阵。大的比例,结合大的条件索引,确定涉及近依赖关系的变量组。比例的大小可以衡量依赖关系对回归退化的严重程度。

用于绘制图形对象的句柄,作为图形数组返回。h包含惟一的情节标识符,可以使用该标识符查询或修改情节的属性。

collintest情节只有你设定好了“阴谋”,“上”

更多关于

全部折叠

Belsley共线性诊断

Belsley共线性诊断评估变量间共线性的强度和来源多元线性回归模型

为了评估共线性,软件进行计算奇异值缩放的变量矩阵,X,然后将它们转换为条件指数.条件指标确定变量矩阵中变量之间任何近似依赖关系的数量和强度。该软件根据奇异值分解回归系数的普通最小二乘(OLS)估计的方差,以确定每个近依赖项所涉及的变量,以及依赖项降低回归的程度。

条件指数

条件指数对于一个比例矩阵X中任何邻近依赖项的数量和强度X

按比例缩小的矩阵Xp列和奇异值 年代 1 年代 2 年代 p 的列的条件索引X 年代 1 / 年代 j j= 1,…,p

所有的条件索引都限定在1和条件数

条件数

条件数缩放矩阵的X是检测共线性的全面诊断。

按比例缩小的矩阵Xp列和奇异值 年代 1 年代 2 年代 p ,条件号为 年代 1 / 年代 p

当列按比例缩放时,条件数的下界为1X正交。当变量表现出更大的依赖性时,条件数增加。

作为诊断的条件数的一个限制是,它不能提供任何近依赖关系的强度和来源的细节。

多元线性回归模型

一个多元线性回归模型是模型的形式吗 Y X β + ε X是回归变量的设计矩阵,和β是回归系数的向量。

奇异值

奇异值缩放矩阵的X是矩阵的对角元素吗年代在奇值分解中 U 年代 V

按降序表示缩放矩阵的奇异值Xp列是 年代 1 年代 2 年代 p

方差分解比例

方差分解比例确定涉及近依赖关系的变量组,以及依赖关系降低回归的程度。

从奇异值分解 U 年代 V 缩放设计矩阵X(与p列),让:

  • V的标准正交特征向量的矩阵 X X

  • 年代 1 年代 2 年代 p 为矩阵的有序对角元素年代

多元线性回归系数OLS估计的方差β,和成正比

V 1 ) 2 / 年代 1 2 + V 2 ) 2 / 年代 2 2 + + V p ) 2 / 年代 p 2

在哪里 V j ) 表示元素(j)V

方差分解比例(j)是比例项j相对于整个和,j= 1,…,p

条款 年代 j 2 特征值是否按比例缩放 X X .因此,较大的方差分解比例对应较小的特征值 X X ,共线性的常见诊断。奇异值分解提供了一个更直接的,数值稳定的观点的特征系统的比例 X X

提示

  • 出于共线性诊断的目的,Belsley[1]显示了设计矩阵的列缩放,X,总是可取的。然而,他也指出,把数据放在中心X是不可取的。对于带有截距的模型,如果将数据集中X,那么常量项在任何近似依赖项中的作用就会被隐藏,并产生误导性的诊断结果。

  • 识别大条件指标和方差分解比例的容差可与标准假设检验中的临界值相媲美。经验决定了最有用的容忍度,但实验表明collintest默认是一个很好的起点[1]

参考文献

[1] Belsley, D. A., E. Kuh,和R. E. Welsh。回归诊断.纽约:John Wiley & Sons, Inc., 1980。

[2]法官,G. G., W. E. Griffiths, R. C. Hill, H. Lϋtkepohl和T. C. Lee。计量经济学的理论与实践.纽约:John Wiley & Sons, Inc., 1985。

另请参阅

介绍了R2012a