主要内容

bayeslm

创建贝叶斯线性回归模型对象

描述

要创建用于多元时间序列分析的贝叶斯向量自回归(VARX)模型,请参见bayesvarm

实例

PriorMdl= bayeslm (NumPredictors)创建贝叶斯线性回归模型对象(PriorMdl)组成的NumPredictors预测因子、截距和漫反射、联合先验分布βσ2.PriorMdl是定义先验分布和的维数的模板β

实例

PriorMdl= bayeslm (NumPredictors,'ModelType”,modelType)指定联合先验分布modelTypeβσ2..对于此语法,modelType可以是:

  • “共轭”,“semiconjugate”,或“扩散”创建标准贝叶斯线性回归先验模型

  • “mixconjugate”,“mixsemiconjugate”,或“套索”创建用于预测变量选择贝叶斯线性回归模型前

例如,“ModelType”、“共轭”指定高斯似然的共轭先验,即,β|σ2.如高斯,σ2.作为逆伽马。

实例

PriorMdl= bayeslm (NumPredictors,'ModelType,模型类型,名称,值)使用由一个或多个名称-值对参数指定的其他选项。例如,您可以指定是包括回归截距还是为联合先验分布指定其他选项modelType

  • 如果您指定“ModelType”、“经验”,您还必须指定BetaDrawsSigma2Draws名称-值对参数。BetaDrawsSigma2Draws描述各自的先验分布。

  • 如果您指定'ModelType', '自定义',您还必须指定日志PDF名称-值对参数。日志PDF完全表征关节先验分布。

例子

全部折叠

考虑预测美国实际国民生产总值的多元线性回归模型(GNPR使用工业生产指数的线性组合()新闻学会),总就业人数(E)及实际工资(WR).

GNPR T = β 0 + β 1. 新闻学会 T + β 2. E T + β 3. WR T + ε T

对所有 T , ε T 是一系列均值为0,方差为0的独立高斯扰动吗 σ 2.

假设回归系数 β = [ β 0 , , β 3. ] 和干扰方差 σ 2. 为随机变量,其先验值和分布未知。在这种情况下,使用非信息的jefferies先验:联合先验分布与 1. / σ 2.

这些假设和数据的似然性意味着一个分析上可处理的后验分布。

创建用于线性回归参数漫先验模型,这是默认模型类型。指定预测器的数量P

p = 3;Mdl = bayeslm (p)
Mdl = diffuseblm with properties: NumPredictors: 3 Intercept: 1 VarNames:{4 x1细胞}|意味着性病CI95积极的分布  ----------------------------------------------------------------------------- 拦截| 0正(南南)0.500一个β(1)| 0正成正比(南南)0.500一个β(2)| 0正成正比(南南)0.500一个β(3)| 0正成正比(南[NaN, NaN] 1.000与1/Sigma2成正比

Mdl是一个漫射贝叶斯线性回归模型对象表示回归系数的先验分布和扰动方差。bayeslm在命令行中显示先前发行版的摘要。由于先前发行版是非信息性的,并且模型不包含数据,因此该摘要很简单。

如果你有数据,你可以通过先验模型来估计后验分布的特征Mdl和数据估计

考虑线性回归模型默认扩散先验模型.假设这些先验分布:

  • β | σ 2. N 4. ( M , v ) M 是一个4 × 1的均值向量吗 v 是一个4 × 4的正定协方差矩阵。

  • σ 2. G ( A. , B ) A. B 分别是逆伽马分布的形状和比例。

这些假设和数据似然性意味着一个正常的逆伽马半共轭模型。条件后验概率与先验数据似然性共轭,但边际后验概率在分析上难以处理。

为线性回归参数建立一个正-逆-半共轭先验模型。指定预测器的数量P

p = 3;Mdl = bayeslm (p,“ModelType”,“semiconjugate”)
Mdl =半jugateblm with properties: NumPredictors: 3 Intercept: 1 VarNames: {4x1 cell} Mu: [4x1 double] V: [4x4 double] A: 3 B:1 |意味着性病CI95积极的分布  ------------------------------------------------------------------------------- 拦截| 0 100 [-195.996,195.996]0.500 N(0.00、100.00 ^ 2)β(1)| 0 100 [-195.996,195.996]0.500 N(0.00、100.00 ^ 2)β(2)| 0 100 [-195.996,195.996]0.500 N(0.00、100.00 ^ 2)β(3)| 0 100 [-195.996,195.996] 0.500 N (0.00, 100.00^2) Sigma2 | 0.5000 0.5000 [0.138, 1.616] 1.000 IG(3.00, 1)

Mdl是一个semiconjugateblm贝叶斯线性回归模型对象表示回归系数的先验分布和扰动方差。bayeslm在命令行中显示以前发行版的摘要。例如积极的表示对应参数为正的先验概率。

如果有数据,则可以通过将先验模型估计的边际或条件后验分布的特性Mdl和数据估计

考虑线性回归模型默认扩散先验模型.假设这些先验分布:

  • β | σ 2. N 4. ( M , σ 2. v ) M 是一个4 × 1的均值向量吗 v 是一个按比例缩放的4×4正定协方差矩阵 M = [ - 2. 0 4. 0 1. 2. ] V是单位矩阵。

  • σ 2. G ( A. , B ) A. B 分别是逆伽马分布的形状和比例。

这些假设和数据可能性意味着正常的逆伽马共轭模型。

建立线性回归参数的正-逆-共轭先验模型。指定预测器的数量P并将回归系数名称设置为相应的变量名称。

p = 3;Mdl = bayeslm (p,“ModelType”,“共轭”,“亩”,[-20; 4; 0.1; 2],“V”,眼(4),......“VarNames”,[“他们”“E”“福”])
MDL = conjugateblm与属性:NumPredictors:3截取:1个VarNames:{4X1细胞}穆:[4X1双】V:[4×4双] A:3 B:1 |均值标准CI95正分布----------------------------------------------------------------------------------拦截|-20 0.7071 [-21.413,-18.587]0.000吨(-20.00,0.58 ^ 2,6)IPI |4 0.7071 [2.587,5.413]1.000吨(4.00,0.58 ^ 2,6)E |0.1000 0.7071 [-1.313,1.513]0.566吨(0.10,0.58 ^ 2,6)WR |2 0.7071 [0.587,3.413]0.993吨(2.00,0.58 ^ 2,6)西格玛-2 |0.5000 0.5000 [0.138,1.616] 1.000 IG(3.00,1)

Mdl是一个conjugateblm贝叶斯线性回归模型对象表示回归系数的先验分布和扰动方差。bayeslm在命令行中显示以前发行版的摘要。尽管bayeslm给截距和干扰方差指定名称,所有其他系数都有指定的名称。

默认情况下,bayeslm设置形状和比例为3.1., 分别。假设你有先验知识的形状和规模5.2.

设置的现有形状和尺度 σ 2. 它们的假定值。

Mdl。A.=5.;Mdl。B=2.
Mdl = conjugateblm with properties: NumPredictors: 3 Intercept: 1 VarNames: {4x1 cell} Mu: [4x1 double] V: [4x4 double] A: 5 B:2 |意味着性病CI95积极的分布  ---------------------------------------------------------------------------------- 拦截| -20 0.3536 [-20.705,-19.295]0.000 t(-20.00、0.32 ^ 2,10)IPI | 4 0.3536 [3.295, 4.705] 1.000 t E(4.00、0.32 ^ 2,10)| 0.1000 - 0.3536[-0.605,0.805]0.621吨(0.10、0.32 ^ 2,10)WR | 2 [1.295, 0.35361.000 t (2.00, 0.32^2, 10) Sigma2 | 0.1250 0.0722 [0.049, 0.308] 1.000 IG(5.00, 2)

bayeslm根据形状和比例的更改更新先前的分布摘要。

考虑线性回归模型默认扩散先验模型.假设这些先验分布:

  • $\beta\u j\vert\sigma^2$是四维T每个分量有50个自由度的分布,单位矩阵为相关矩阵。而且,分布集中在${\left[{\begin{array}{*{20}{c}}{-25}&;4&;0&;3\end{array}\right]^\prime}$并且每个部件是由载体的相应元件缩放左${\[{\开始{数组}{* {20}{c}}{10} & # 38; 1 & # 38; 1 & # 38;结束1 \{数组}}\右]^ \ '}$

  • 美元\σ^ 2 \ sim搞笑(3,1)美元

bayeslm对待这些假设和数据可能性,就好像相应的后验在分析上是棘手的。

声明一个MATLAB®函数:

  • 接受的值β\美元\σ^ 2美元在列向量中合并,并接受超参数的值

  • 返回联合先验分布的值,$ \ PI \左(\-β,\西格玛^ 2 \右)$给出的值β\美元\σ^ 2美元

函数logPDF = priorMVTIG (params, ct,圣,景深,C, a, b)的多元t倍逆伽马%priorMVTIG登录密度%priorMVTIG将参数(1:end-1)传递到多元t密度%具有每个组件的自由度和正自由度的函数%明确相关矩阵C. priorMVTIG返回的产物的对数%两个评估密度。%% params:密度评估的参数值% m乘1的数字向量。%%ct:多变量t分布分量中心,an(m-1)-by-1%数值向量。元素对应于第一个m-1元素%的参数。%% st:多元t分布分量尺度,(m-1) × 1%数字(m-1)-乘1数字向量。元素对应于%params的第一个m-1元素。%% dof:多元t分布的自由度,a%数值标量或(m-1)-by-1数值向量。priorMVTIG展开%标量,使dof = dof*ones(m-1,1)。景深的元素%对应于参数(1:end-1)的元素。%% C:多元t分布的相关矩阵%(M-1)-by-(M-1)的对称,正定矩阵。行和%列对应params(1:end-1)中的元素。%% a:逆伽马形状参数,一个正数值标量。%%B:逆伽马尺度参数,一个正标量。%的β=参数(1:(端-1));σ-2 =参数(端);tVal =(β -  CT)./ ST;mvtDensity = mvtpdf(tVal,C,自由度);igDensity =σ-2 ^( -  A-1)* EXP( -  1 /(σ-2 * B))/(伽马(一)* B ^ a)的logPDF =日志(mvtDensity * igDensity);终止

创建一个匿名函数priorMVTIG,但只接受参数值并保持超参数值固定。

景深= 50;C =眼(4);ct = [-25;4;0;3);圣= [10;1;1;1); a = 3; b = 1; prior = @(params)priorMVTIG(params,ct,st,dof,C,a,b);

为线性回归参数创建自定义联合先验模型。指定预测器的数量P.此外,指定功能的手柄priorMVTIG,并传递超参数值。

p = 3;Mdl = bayeslm (p,“ModelType”,“自定义”,“LogPDF”,先前)
Mdl = customblm with properties: NumPredictors: 3 Intercept: 1 VarNames: {4x1 cell} LogPDF: @(params)priorMVTIG(params,ct,st,dof,C,a,b)

Mdl是一个定制贝叶斯线性回归模型对象表示回归系数的先验分布和扰动方差。在这种情况下,bayeslm不在命令行显示以前发行版的摘要。

考虑线性回归模型默认扩散先验模型

假设这些先验分布:

  • K= 0,…,3, β K | σ 2. 它的拉普拉斯分布的均值是0,标度是 σ 2. / λ , 在哪里 λ 为收缩参数。系数是条件无关的。

  • σ 2. G ( A. , B ) A. B 分别是逆伽马分布的形状和比例。

建立贝叶斯线性回归的先验模型使用bayeslm.指定预测器的数量P以及变量名。

p=3;PriorMdl=bayeslm(p,“ModelType”,“套索”,“VarNames”,[“他们”“E”“福”]);

PriorMdl是一个lassoblm贝叶斯线性回归模型对象表示回归系数的先验分布和扰动方差。默认情况下,bayeslm收缩属性0.01截距和1.模型中的其他系数。

使用点表示法,通过指定包含新系数值的3×1向量,更改除截距之外的所有系数的默认收缩率兰姆达的属性PriorMdl

  • 归因于10新闻学会WR

  • 因为E是否有一个比其他变量大几个数量级的尺度,归属于收缩1 e5到它。

拉姆达(2:结束)包含与中指定变量对应的系数的收缩VarNames的属性PriorMdl

PriorMdl。兰姆达=[10;1 e5;10);

加载Nelson-Plosser数据集。为响应和预测器系列创建变量。

负载Data_NelsonPlosserX = {数据表:,PriorMdl.VarNames(2:结束)};Y = {数据表:,“GNPR”};

通过将先前的模型和数据传递给估计,即通过估计的后验分布 β σ 2. .贝叶斯拉索回归使用马尔可夫链蒙特卡罗(MCMC)从后验采样。为了繁殖,随机播种。

rng (1);PosteriorMdl =估计(PriorMdl, X, y);
方法:lasso MCMC sampling with 10000 draw观测数:62预测数:4 |意味着性病CI95积极的分布  ------------------------------------------------------------------------- 拦截| -1.3472 - 6.8160[-15.169,11.590]0.427经验IPI | 4.4755 - 0.1646[4.157, 4.799] 1.000经验E | 0.0001 - 0.0002[-0.000, 0.000] 0.796经验或者说是| 3.1610 - 0.3136 (2.538,11.1180 [42.319, 85.085] 1.000 Empirical Sigma2 | 60.1452

绘制后验分布图。

图(PosteriorMdl)

图中包含5个轴对象。带有标题截距的轴对象1包含线条类型的对象。带有标题IPI的轴对象2包含线条类型的对象。带有标题E的轴对象3包含线条类型的对象。带有标题WR的轴对象4包含线条类型的对象。带有标题Sigma2的轴对象5包含线条类型的对象。

假设收缩10,则分布E在0附近密度相当大。因此,E可能不是一个重要的预测因素。

输入参数

全部折叠

贝叶斯多元线性回归模型中预测变量的个数,指定为非负整数。

NumPredictors必须与在模型估计或模拟期间指定的预测器数据中的列数相同。

计算模型中预测值的数量时,排除由拦截.如果在截取项的预测器数据中包含一列1,则将其计算为预测器变量并指定“拦截”,错

数据类型:双倍的

名称-值参数

指定可选的逗号分隔的字符对名称,值论据。的名字参数名和价值为对应值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数名称1,值1,…,名称,值

例子:“ModelType”、“共轭”、“亩”,1:3,‘V’,1000 *眼(3),“一个”,“B”,0.5指定的先验分布β给予Sigma2高斯函数是均值向量吗1:3和协方差矩阵眼睛Sigma2 * 1000 * (3),和分配Sigma2逆有形状吗1.和规模0.5
所有先前发行版的选项

全部折叠

(β,σ2.),指定为逗号分隔的对,由“ModelType”和下表中的值。

对于标准的贝叶斯回归模型,请在该表中选择一个值。

价值 描述
“共轭”

Normal-inverse-gamma共轭模型

  • 先验分布是

    β | σ 2. ~ N P + 1. ( μ , σ 2. v ) σ 2. ~ G ( A. , B )

    βσ2.是相关的。

  • 相应的边际和条件后验分布具有闭合形式(参见易于分析后验).

可以使用μ,v,A.,B名称-值对参数。

“semiconjugate”

正规逆gamma半共轭模型

  • 先验分布是

    β | σ 2. ~ N P + 1. ( μ , v ) σ 2. ~ G ( A. , B )

    βσ2.是独立的。

  • 相应的边缘后验分布不是封闭形式,但条件后验分布是封闭形式(见易于分析后验).

可以使用μ,v,A.,B名称-值对参数。

“扩散”

扩散先验分布

  • 联合优先pdf是

    F β , σ 2. ( β , σ 2. ) 1. σ 2.

  • 相应的边际和条件后验分布具有闭合形式(参见易于分析后验).

'经验'

定制的先验分布

  • 还必须指定BetaDrawsSigma2Draws名称-值对参数。

  • 相应的边际和条件后验分布没有闭合形式。

  • 经验模型更适合根据新数据更新后验分布。

“自定义”

定制的先验分布

  • 还必须指定日志PDF名称-值对参数。

  • 相应的边际和条件后验分布没有闭合形式。

对于执行预测变量选择的贝叶斯回归模型,请在该表中选择一个值。

价值 描述
“mixconjugate”

随机搜索变量选择[1]共轭先验分布

  • 数据似然、先验分布和后验分布构成一个共轭高斯混合模型。

  • βσ2.为相依随机变量。

有关详细信息,请参阅mixconjugateblm

“mixsemiconjugate”

科学价值[1]semiconjugate先验分布

  • 数据似然性,先验分布,并且后验分布撰写semiconjugate高斯混合模型。

  • βσ2.是独立的随机变量。

有关详细信息,请参阅mixsemiconjugateblm

“套索”

贝叶斯拉索回归先验分布[3]

  • 条件在σ2.,各回归系数的先验分布为双指数分布,平均值为0,标度为0σ/λ, 在哪里λ为套索收缩参数。作为λ增加,系数趋于0。

  • βσ2.为相依随机变量。回归系数是独立的,这是一个先验。

您选择的先前模型类型取决于您对参数联合分布的假设。你的选择会影响后验估计和推断。有关详细信息,请参阅实现贝叶斯线性回归

例子:“ModelType”、“共轭”

数据类型:char

标志,用于包含回归模型截距,指定为逗号分隔的对,由“拦截”和这个表中的值。

价值 描述
从回归模型中排除截距。因此β是一个P维向量,P价值是多少NumPredictors
真正的 在回归模型中包含一个截距。因此,β是(P+ 1)维向量。该规范导致T-by-1的人的矢量来估计和模拟过程中预先考虑到预测数据。

如果包括那些在截距项的预测数据的一列,然后指定“拦截”,错

例子:“拦截”,错

用于显示器的预测器变量名,指定为逗号分隔的一对组成的“VarNames”以及字符向量的字符串向量或单元向量。VarNames必须包含NumPredictors元素。VarNames(J)变量的名称是否在列中J在估计、模拟或预测期间指定的预测器数据集。

默认值是{'Beta(1)','Beta(2)','Beta(P)}, 在哪里P价值是多少NumPredictors

请注意

你不能设置拦截或干扰方差的名称。在显示器,bayeslm为拦截提供名称拦截干扰方差Sigma2.因此,你不能使用“拦截”“西格玛-2”作为预测的名字。

例子:“VarNames”,(“失业率会”;“CPI”)

数据类型:细绳|细胞|char

共轭和半共轭关节的先验分布的选择β

全部折叠

上高斯先验的平均超参数β,指定为逗号分隔的对,由“亩”和一个数字向量。

如果μ是一个向量,那么它必须有NumPredictorsNumPredictors + 1元素。

  • NumPredictors元素,bayeslm的先前均值NumPredictors仅限预测器。预测器对应于预测器数据中的列(在估计、模拟或预测期间指定)。bayeslm忽略模型中的截距,即,bayeslm指定任何截取的默认优先平均值。

  • NumPredictors + 1元素,第一个元素对应于前面的截距均值,所有其他元素对应于预测器。

例子:“亩”,[1;0.08;2]

数据类型:双倍的

高斯先验的条件协方差矩阵超参数β,指定为逗号分隔的对,由“V”和一个C-经过-C对称正定矩阵。C可以NumPredictorsNumPredictors + 1

  • 如果CNumPredictors,然后bayeslm设置在现有的协方差矩阵,以

    [ 1. E 5. 0 0 0 v 0 ]

    bayeslm属性将默认先验协方差指定给截距,以及属性v数据中预测变量的系数。的行和列v对应于预测器数据中的列(变量)。

  • 如果CNumPredictors + 1,然后bayeslm将整个先验协方差设置为v.第一行和第一行对应于截距。所有其他行和列对应于预测器数据中的列。

默认值为a公寓前.对于一个自适应前,指定diag(Inf(截取+NumPredictors,1)).自适应先验表示零精度,以便先验分布对后验分布的影响尽可能小。

ModelType,共轭,v之前的协方差是β高达σ2.

例子:“V”,诊断接头(正(3,1))

数据类型:双倍的

贝叶斯套索回归的选择

全部折叠

Lasso正则化参数为所有回归系数,指定为逗号分隔对组成“拉姆达”和正数值标量或(拦截+NumPredictors)-乘1正数值向量。更大的值兰姆达使相应的系数收缩到接近零。

认为X是一个T-经过-NumPredictors在估计、模拟或预测期间指定的预测数据矩阵。

  • 如果兰姆达是一个向量拦截真正的,λ(1)为截距的收缩,λ(2)是第一个预测器系数的收缩率X (: 1),λ(3)是用于第二预测器的系数的收缩X (:, 2),…, 和λ(NumPredictors + 1)收缩是最后一个预测因子的系数吗X(:,NumPredictors)

  • 如果兰姆达是一个向量拦截,λ(1)是第一个预测器系数的收缩率X (: 1),…, 和Lambda(NumPredictors)收缩是最后一个预测因子的系数吗X(:,NumPredictors)

  • 如果你提供标量s兰姆达,然后是所有的预测系数X收缩s

    • 如果拦截真正的,截距有收缩0.01,lassoblm商店[0.01;s*one(NumPredictors,1)]兰姆达

    • 否则,lassoblm商店*的(NumPredictors, 1)兰姆达

例子:“λ”6

数据类型:双倍的

先验分布的选项βγ用于SSVS预测变量选择

全部折叠

高斯混合物之前对逐个分量均值超参数β,指定为逗号分隔的对,由“亩”一个(截距+NumPredictors)-by-2数字矩阵。第一列包含组分1(可变列入制度,即在现有的装置,γ= 1)。第二列包含组件2的先前方法(变量排除机制,即,γ= 0)。

  • 如果拦截,然后μNumPredictors行。bayeslm的先前均值NumPredictors与预测器数据集中列对应的系数,您在估计、模拟或预测期间指定这些列。

  • 否则,μNumPredictors + 1元素。第一元件相当于截距的现有装置,而所有其它元件对应于预测变量。

提示

要执行SSV,请使用默认值μ

数据类型:双倍的

高斯混合物之前对逐个分量方差因子或方差超参数β,指定为逗号分隔的对,由“V”一个(截距+NumPredictors)-by-2正数值矩阵。第一列包含组成部分1(变量包含制度,即,γ=1)。第二列包含组件2的先验方差因子(变量排除制度,即,γ= 0)。对于结合模型(“ModelType”、“mixconjugate”),v包含方差因子,对于半共轭模型为(“ModelType”、“mixsemiconjugate”),v包含差异。

  • 如果拦截,然后vNumPredictors行。bayeslm设置的先验方差因子NumPredictors与预测器数据集中列对应的系数,您在估计、模拟或预测期间指定这些列。

  • 否则,vNumPredictors + 1元素。第一个元素对应于截距的先验方差因子,所有其他元素对应于预测变量。

提示

  • 要执行的SSVs,指定一个更大的方差因子为1制度比制度2。也就是说,对于所有的J,指定V(J,1)>V(J,2)

  • 有关要指定的值的详细信息v看见[1]

数据类型:双倍的

先验概率分布的变量包含和排除机制,指定为逗号分隔对组成“概率”一个(拦截+NumPredictors)中[0,1]值的数字向量,或形式的函数句柄@fcnName, 在哪里fcnName是函数名。概率表示的先验概率分布γ= {γ1.、……γK},其中:

  • K=拦截+NumPredictors,这是回归模型中的系数数。

  • γK∈{0,1}K=1.、……K因此,样本空间的基数为2K

  • γK=1表示变量VarNames(K)包括在模型中,以及γK= 0表示该变量被排除在模型之外。

如果概率是一个数字向量:

  • 行对应于中的变量名VarNames.对于包含截距的模型,截距包含的先验概率为概率(1)

  • K= 1,…,K,排除变量的先验概率K是1 -可能性(K).

  • 在所有变量和截距中,变量包含机制的先验概率是独立的。

如果概率是一个函数句柄,则它表示变量包含区域概率的自定义先验分布。相应的函数必须具有此声明语句(参数和函数名称可以不同):

logprob = regimeprior (varinc)

  • logprob是一个数值标量,表示先验分布的对数。你可以把先验分布写成比例常数。

  • varinc是一个K1逻辑向量。元素对应于中的变量名VarNames并指出相应变量存在的区域。varinc (K)=真正的表明VarName (K)包括在模型中,以及varinc (K)=表示已将其从模型中排除。

您可以包含更多的输入参数,但是在调用时必须知道它们bayeslm

有关要指定的值的详细信息概率看见[1]

数据类型:双倍的|功能手柄

先验相关矩阵β在混合模型两种组分,指定为逗号分隔的一对组成的“相关”

一个(拦截+NumPredictors)——- (拦截+NumPredictors)数值的正定矩阵。因此,先验协方差矩阵为分量J在混合模型中为:

  • 共轭(“ModelType”、“mixconjugate”),σ-2 * DIAG(SQRT(V(:,J))) *相关性*诊断接头(sqrt (V (:,J)))

  • 半共轭(“ModelType”、“mixsemiconjugate”),诊断接头(sqrt (V (:,J))) *相关性*诊断接头(sqrt (V (:,J)))

在哪里西格玛2σ2.v是系数方差因子或方差的矩阵。

中的行和列对应于变量名VarNames

默认情况下,回归系数是不相关的,取决于制度。

请注意

你可以提供任意大小的数字矩阵。然而,如果你的说明书不是正定的,bayeslm发出警告,并替换您的规格CorrelationPD,地点:

CorrelationPD = 0.5 *(+相关性的相关性“。);

提示

有关要指定的值的详细信息相关看见[1]

数据类型:双倍的

先验分布的选项σ2.

全部折叠

逆先验的形状超参数σ2.,指定为逗号分隔的对,由'一种'和一个数字标量。

A.至少- (截距+ NumPredictors)/ 2

B如果固定不变,逆伽马分布会随着时间的推移变得更高、更集中A.增加。这一特性衡量的先验模型σ2.比后验估计中的可能性更大。

关于逆分布的函数形式,见易于分析后验

此选项不适用于经验或自定义的先验分布。

例子:“一个”,0.1

数据类型:双倍的

逆伽马现有上的尺度超参数σ2.,指定为逗号分隔的对,由'B'和正标量或Inf

A.如果固定不变,逆伽马分布会随着时间的推移变得更高、更集中B增加。这一特性衡量的先验模型σ2.比后验估计中的可能性更大。

此选项不适用于经验或自定义的先验分布。

例子:“B”,5

数据类型:双倍的

经验联合先验分布的必要选项

全部折叠

从的先验分布随机样品β,指定为逗号分隔的对,由“BetaDraws”和一个(拦截+NumPredictors)———NumDraws数字矩阵。行对应回归系数:第一行对应截距,随后的行对应预测器数据中的列。列对应于先前分布的连续绘制。

BetaDrawsSigma2Draws必须有相同的列数。

为获得最佳结果,请抽取大量样本。

数据类型:双倍的

从的先验分布随机样品σ2.,指定为逗号分隔的对,由“Sigma2Draws”和1 -NumDraws数字行向量。列对应于先前分布的连续绘制。

BetaDrawsSigma2Draws必须有相同的列数。

为获得最佳结果,请抽取大量样本。

数据类型:双倍的

自定义优先发行版的必需选项

全部折叠

的联合概率密度函数的对数β,σ2.),指定为逗号分隔的对,由“LogPDF”和一个函数句柄。

认为logprior是MATLAB的名称®函数定义(β,σ2.).然后,logprior必须有这张表格。

函数(logpdf,glpdf] =logprior(参数个数)…终止
哪里:

  • logpdf是一个数值标量,表示(β,σ2.).

  • glpdf是一个(拦截+NumPredictors+ 1)-乘1的数字向量表示的梯度logpdf.元素对应于的元素参数个数

    glpdf是一个可选的输出参数,并且只有哈密顿蒙特卡罗采样器(见hmcSampler)应用它。如果知道某些参数的解析偏导数,但不知道其他参数的解析偏导数,则设置glpdf对应于的未知偏导数.MATLAB计算缺失偏导数的数值梯度,这很方便,但会减慢采样速度。

  • 参数个数是一个(拦截+NumPredictors+ 1)-乘1的数字向量。第一个拦截+NumPredictors元素必须与的值相对应β,最后一个元素必须对应的值σ2..第一个元素β是截距,如果存在的话。所有其他元素对应于预测数据中的预测变量,您在估计、模拟或预测期间指定这些预测变量。

例子:LogPDF, @logprior

输出参数

全部折叠

贝叶斯线性回归模型存储先验模型的假设,返回在该表中的一个对象。

价值ModelType 返回贝叶斯线性回归模型对象
“共轭” conjugateblm
“semiconjugate” semiconjugateblm
“扩散” 漫射
'经验' empiricalblm
“自定义” 定制
“mixconjugate” mixconjugateblm
“mixsemiconjugate” mixsemiconjugateblm
“套索” lassoblm

PriorMdl仅指定线性回归模型的联合先验分布和特征。模型对象是用于进一步使用的模板。为了将数据合并到模型中进行后验分布分析,将模型对象和数据传递给适当的目标函数,例如,估计模拟

更多关于

全部折叠

贝叶斯线性回归模型

A.贝叶斯线性回归模型将参数βσ2.在多元线性回归(MLR)模型YT=xTβ+εT为随机变量。

为次T= 1,…,T:

  • YT为观察到的响应。

  • xT是一个1 - (P+ 1)的观测值的行向量P预测因子。为了适应模型拦截,x1.T= 1 for allT

  • β是(P+ 1)组成列的变量对应的回归系数的列向量xT

  • εT为均值为0的随机扰动,Cov(ε) =σ2.T×T, 尽管ε是一个T包含所有扰动的-乘1向量。这些假设意味着数据的可能性是

    ( β , σ 2. | Y , x ) = T = 1. T ϕ ( Y T ; x T β , σ 2. )

    ϕ(YT;xTβ,σ2.)是具有平均值的高斯概率密度xTβ和方差σ2.评估在YT;

在考虑数据之前,您需要执行一个联合先验分布假定(β,σ2.).在贝叶斯分析中,通过使用从数据的可能性中获得的有关参数的信息来更新参数的分布。结果是关节后分布的(β,σ2.) 或者有条件的后验分布参数的选择。

工具书类

[1]乔治,E.I.和R.E.麦卡洛赫,“通过吉布斯抽样进行变量选择。”美国统计协会杂志.卷。88,423号,1993,第881-889。

[2]库普,G.,D.J.波里埃和J.L.托比亚斯。贝叶斯计量经济方法.纽约,纽约:剑桥大学出版社,2007。

[3]帕克,T,和g。卡塞拉。“贝叶斯套索”。美国统计协会杂志.第103卷,第482期,2008,第681-686页。

R2017a中引入