总结

用于预测变量选择的贝叶斯线性回归模型的分布汇总统计

描述

要获得标准贝叶斯线性回归模型的概要,请参见总结

例子

总结(Mdl)的随机回归系数和扰动方差的列表摘要贝叶斯线性回归模型Mdl在命令行。对于每个参数,摘要包括:

  • 标准差(方差的平方根)

  • 95%为可信区间

  • 参数大于0的概率

  • 分布的描述,如果知道的话

  • 在随机搜索变量选择(SSVS)预测变量选择模型中,一个系数应该包含在模型中的边际概率

例子

SummaryStatistics=总结(Mdl)返回一个结构数组,其中的表汇总了回归系数和扰动方差,并描述了参数的联合分布。

例子

全部折叠

考虑预测美国实际国民生产总值(gdp)的多元线性回归模型(GNPR)采用工业生产指数的线性组合(新闻学会)、总就业人数(E)和实际工资(或者说是)。

GNPR t = β 0 + β 1 新闻学会 t + β 2 E t + β 3. 或者说是 t + ε t

对所有 t , ε t 一系列独立的高斯扰动的均值和方差是否为0 σ 2

假设这些先验分布 k = 0,…,3:

  • β k | σ 2 , γ k = γ k σ V k 1 Z 1 + ( 1 - γ k ) σ V k 2 Z 2 ,在那里 Z 1 Z 2 是独立的标准正态随机变量。因此,系数呈高斯混合分布。假设所有系数都是先验的条件独立的,但它们依赖于扰动方差。

  • σ 2 G ( 一个 , B ) 一个 B 为反伽马分布的形状和比例尺。

  • γ k { 0 , 1 } 它表示具有离散均匀分布的随机变量-包含状态变量。

为ssv创建一个先验模型。指定预测器的数量p

p = 3;VarNames = [“他们”“E”“福”];PriorMdl = bayeslm (p,“ModelType”,“mixconjugateblm”,“VarNames”,VarNames);

PriorMdl是一个mixconjugateblm用于SSVS预测器选择的贝叶斯线性回归模型对象表示回归系数和扰动方差的先验分布。

总结先验分布。

总结(PriorMdl)
|意味着性病CI95积极分配- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -拦截| 0 1.5890[-3.547,3.547]0.500混合分布IPI | 0 1.5890[-3.547, 3.547] 0.500混合分布E | 0 1.5890[-3.547, 3.547] 0.500混合分布WR | 0 1.5890[-3.547, 3.547] 0.500混合分布Sigma2 | 0.5000 - 0.5000[0.138, 1.616] 1.000搞笑(3.00,1)

该函数显示一个汇总统计信息表和关于命令行上先验分布的其他信息。

加载Nelson-Plosser数据集,并为预测器和响应数据创建变量。

负载Data_NelsonPlosserX = DataTable {: PriorMdl.VarNames(2:结束)};y = DataTable.GNPR;

估计后验分布。抑制估计显示。

PosteriorMdl =估计(PriorMdl, X, y,“显示”、假);

PosteriorMdl是一个empiricalblm的后验分布 β σ 2

从后验分布中获得汇总的统计信息。

摘要=总结(PosteriorMdl);

总结为包含两个字段的结构数组:MarginalDistributionsJointDistribution

使用点符号显示边缘分布摘要。

summary.MarginalDistributions
ans =5×5表标准Std CI95正态分布的平均正态分布为正态截距-18.66 10.348 -37.006 0.8406 0.0412{“经验的”}IPI 4.4555 4.1561 4.7561 1{“经验的”}E 0.00096765 0.0003759 0.000214644 0.9968{“经验的”}WR 2.4739 0.36337 1.7607 3.1882 1{“经验的”}Sigma2 47.773 8.6863 33.574 67.585 1{“经验的”}

MarginalDistributions字段是关于后验分布的统计和其他信息的汇总表。

输入参数

全部折叠

用于预测变量选择的贝叶斯线性回归模型,在本表中指定为模型对象。

模型对象 描述
mixconjugateblm 相关的,用于SSVS预测变量选择的gaussi -mix -inverse-gamma共轭模型,由bayeslm
mixsemiconjugateblm 独立的、高斯-混合-反-伽玛半聚模型用于SSVS预测变量的选择,由bayeslm
lassoblm 贝叶斯lasso回归模型由bayeslm

输出参数

全部折叠

参数分布摘要,作为结构数组返回,其中包含该表中的信息。

结构域 描述
MarginalDistributions

包含参数分布摘要的表。行对应于参数。列对应于:

  • 估计后验均值(的意思是)

  • 标准偏差(性病)

  • 95%的可信区间(CI95)

  • 参数大于0的后验概率(积极的)

  • 参数的边缘或条件后验分布的描述(分布)

行名称是其中的名称Mdl.VarNames。最后一行的名称是Sigma2

JointDistribution

一个描述回归系数分布的字符串标量(β)和扰动方差(Sigma2当已知)。

分布的描述:

  • N(μ,V)为具有均值的正态分布μ和方差矩阵V。这种分布可以是多元的。

  • 搞笑(A, B)为与形状的反伽马分布一个和规模B

  • 混合分布代表一个学生的t混合分布。

请注意

如果Mdl是一个lassoblm模型和Mdl.Probability函数句柄是否表示状态概率分布,则总结无法估计系数的先验分布统计信息。因此,系数统计对应的项为值。

更多关于

全部折叠

贝叶斯线性回归模型

一个贝叶斯线性回归模型将参数βσ2在多元线性回归(MLR)模型中yt=xtβ+εt为随机变量。

为次t= 1,…,T:

  • yt是观察到的响应。

  • xt是一个1 - (p的观测值的行向量p预测因子。为了适应模型截距,x1t= 1t

  • β是(p的各列所对应的回归系数的列向量xt

  • εt为均值为0的随机扰动,Cov(ε)=σ2T×T,而ε是一个T包含所有扰动的-乘-1向量。这些假设意味着数据的可能性是

    ( β , σ 2 | y , x ) = t = 1 T ϕ ( y t ; x t β , σ 2 )

    ϕ(yt;xtβ,σ2)是具有均值的高斯概率密度xtβ和方差σ2评估在yt;

在考虑数据之前,您施加a联合先验分布假设(β,σ2)。在贝叶斯分析中,通过使用从数据的可能性中获得的参数信息来更新参数的分布。结果是联合后验分布(β,σ2)或条件后验分布的参数。

算法

  • 如果Mdl是一个lassoblm模型对象和Mdl.Probability为数值向量,则回归系数的95%可信区间为平均值+ [-2]*Std,在那里的意思是性病是汇总表中的变量。

  • 如果Mdl是一个mixconjugateblmmixsemiconjugateblm模型对象,然后在回归系数的95%可信区间从混合物CDF估计。如果估计失败,则总结返回值来代替。

介绍了R2018b