PPCA

概率主成分分析

折叠所有页面

语法

[多项式系数,分数,pcvar] =车牌提取(Y, K)

[多项式系数,分数,pcvar] =车牌提取(Y, K,名称,值)

[多项式系数,分数,pcvar,μ=车牌提取(___)

[系数_，得分，pcvar，μ，V，S] = PPCA（___)

描述

例子

(_系数,分数,pcvar] = PPCA（Y,K)返回该主分量系数n-通过-p数据矩阵Y基于一个概率主成分分析（PPCA）。它还返回主成分得分，这是的表示Y在主成分空间中，主成分方差，即的协方差矩阵的特征值Y在pcvar。

每一列的_系数包含一个主成分的系数，各列按成分方差的降序排列。行分数对应于观察，列对应于组件。行Y对应于观察和列对应的变量。

该句柄丢失的数据，比如交替的最小二乘算法当任何数据载体具有一个或多个丢失的值的概率主成分分析可能是优选的其它算法。它假定值是随机通过数据集丢失。期望最大化算法用于完全和丢失的数据。

例子

(_系数,分数,pcvar] = PPCA（Y,K,名称,值)返回主分量系数，分数，并且使用附加的选项计算和处理特殊的数据类型，由一个或多个指定的方差名称,值对参数。

例如，可以为剩余方差介绍的初始值，v或更改终止标准。

例子

(_系数,分数,pcvar,亩] = PPCA（___)也返回每个变量的估计均值Y。您可以在前面的语法使用任意的输入参数。

例子

(_系数,分数,pcvar,亩,v,年代] = PPCA（___)还返回在各向同性剩余方差v并在结构趋同的最终结果年代。

例子

全部折叠

执行概率主成分分析

开立真实脚本

加载样本数据。

负载fisheriris

双矩阵MEAS由四种类型的上的花朵，其分别是长度和宽度萼片和花瓣的测量。

随机介绍缺失值。

y =量;rng ('默认');%的再现性IX =随机（“unif”，0,1，大小（Y））<0.20;Y（IX）= NaN的;

现在，大约有20%的数据丢失了南。

执行概率主成分分析和请求分量系数和变化。

[系数_，得分，pcvar，μ= PPCA（Y，3）;_系数

_系数=4×30.3562 0.6709 -0.5518 -0.0765 0.7120 0.6332 0.8592 -0.1597 0.0596 0.3592 -0.1318 0.5395

pcvar

pcvar =3×14.0914 0.2125 0.0617

使用交替最小二乘法进行主成分分析，并要求成分系数和方差。

[COEFF2，score2，pcvar2，MU2] = PCA（Y，'算法','ALS',...'NumComponents'，3）;COEFF2

COEFF2 =4×30.3376 0.4952 0.7406 -0.0731 0.8609 -0.4476 0.8657 -0.1168 -0.1233 0.3623 -0.0086 -0.4857

pcvar2

pcvar2 =3×14.0733 0.2652 0.1222

的系数和所述第一两个主成分的方差是相似的。

另一个来比较结果的方法是找到由系数矢量所跨越的两个空间之间的角度。

子空间（系数_，COEFF2）

ans = 0.0884

这两个空间的夹角很小。这说明这两个结果是接近的。

更改终止条件的概率主成分分析

开立真实脚本

加载样本数据集。

负载进口- 85

数据矩阵X在柱状体13个的连续变量为3〜15：轴距，长度，宽度，高度，遏制重量，发动机尺寸，内孔，冲程，压缩比，马力，峰值转速，城市-MPG，和公路-MPG。变量缸径与冲程以行缺少四个值56至59，并且变量马力和峰转速以行131和132缺失两个值。

执行概率主成分分析和显示前三个主要部件。

[系数_，得分，pcvar] = PPCA（X（：，3:15），3）;

警告：达到迭代1000的最大数量。

对于成本函数终止公差更改为0.01。

选择= statset（“车牌提取”);opt.TolFun = 0.01;

执行概率主成分分析。

[系数_，得分，pcvar] = PPCA（X（：，3:15），3，“选项”，选择）;

警告：达到迭代1000的最大数量。

PPCA现在终止达到循环的最大数之前，因为它符合成本函数的耐受性。

重构意见

开立真实脚本

加载样本数据。

负载哈尔德y =成分;

成分数据包含4个变量的13个观察值。

介绍缺失值的数据。

y(16:结束)=南;

每16个值南。这对应于数据的7.69％。

发现使用PPCA数据的前3个主部件和显示重建的意见。

[系数_，得分，pcvar，μ，V，S] = PPCA（Y，3）;

警告：达到迭代1000的最大数量。

S.Recon

ans =13×46.8536 25.8700 5.8389 59.8730 1.0433 28.9710 14.9654 51.9738 11.5770 56.5067 8.6352 20.5076 11.0835 31.0722 8.0920 47.0748 7.0679 52.2556 6.0748 33.0598 11.0486 55.0430 9.0534 22.0423 2.8493 70.8691 16.8339 5.8656 1.0333 31.0281 19.6907 44.0306 2.0400 54.0354 18.0440 22.0349 20.7822 46.8091 3.7603 25.8081⋮

你也可以用主成分和估计平均数来重建观测结果。

T =得分*系数_” + repmat（亩，13,1）;

结果收敛

开立真实脚本

加载数据。

负载哈尔德

在这里,配料是预测变量的实值矩阵。

执行概率主成分分析和显示系数。

[系数_，得分，pcvariance，μ，V，S] = PPCA（成份，3）;

警告：达到迭代1000的最大数量。

_系数

_系数=4×3-0.0693 -0.6459 0.5673 -0.6786 -0.0184 -0.5440 0.0308 0.7552 0.4036 0.7306 -0.1102 -0.4684

显示在PPCA的收敛算法的结果。

年代

S =同场的结构：W: [4x3双]Xexp: [13x3双]Recon: [13x4双]v: 0.2372数字:1000 RMSResid: 0.2340 nloglk: 149.3388

显示矩阵W。

S.W

ans =4×30.5624 2.0279 5.4075 4.8320 -10.3894 5.9202 -3.7521 -3.0555 -4.1552 -1.5144 -7.2564 11.7122

正交化W恢复系数。

奥尔特(白雪)

ans =4×3-0.0693 0.6459 0.5673 -0.5440 0.4036 0.4036 0.7306 0.1102 -0.4684

输入参数

全部折叠

`Y`- - - - - -输入数据
n-通过-p矩阵

用于计算主成分的输入数据，指定为n-通过-p矩阵。行Y对应于观察和列对应的变量。

数据类型：单|双

`K`- - - - - -主成分数
正整数值小于秩

返回的主成分数，指定为小于数据秩的整数值。最大可能的秩是min(n,p),n是观测值的数量和p是变量的数目。然而，如果数据是相关的，等级可能比小分钟（n,p)。

PPCA订单基于其方差分量。

如果K是min（n,p),PPCA集K等于分钟（n,p） - 1，和'W0'截断为min(p,n） - 1列，如果你指定一个p-通过-pW0矩阵。

例如，根据以下组件方差，您只能请求前三个组件。

例：系数_ = PPCA（Y，3）

数据类型：单|双

名称 - 值对参数

指定可选的逗号分隔的对名称,值参数。名称参数名和值是对应的值。名称必须出现引号内。您可以按照任何顺序指定多个名称和值对参数名1，值1，...，NameN，值N。

例：'W0'，初始化， '选项'，选择指定，对于初始值'W0'在矩阵初始化和PPCA使用定义的选项选择。

`'W0'`- - - - - -初始值的W
随机值的矩阵（默认）|p-通过-k矩阵

初始值的W在里面概率主成分分析算法，指定为逗号分隔的一对组成的'W0'和p-通过-k矩阵。

数据类型：单|双

`'V0'`- - - - - -残差的初始值
随机数（默认）|正标量值

剩余方差的初始值，指定为逗号分隔的一对组成的'V0'而正标量值。

数据类型：单|双

`“选项”`- - - - - -对于迭代选项
结构体

迭代的选项，指定为逗号分隔的对“选项”和一个由statset函数。PPCA在选项结构中使用以下字段。

`'显示'`	显示输出电平。的选择是`“关”`,`'最后'`和`“通路”`。
`'MAXITER'`	步最大数量允许的。默认值是1000。不像在优化设置，达到`MAXITER`值视为收敛。
`'TolFun'`	正整数，说明成本函数终止公差。默认值是1e-6。
`“TolX”`	正整数，说明收敛门槛上，以在要素的相对变化W。默认值是1e-6。

你可以改变这些字段的值，并在指定的新结构PPCA使用“选项”名称-值对的论点。

例：选择= statset（ 'PPCA'）;opt.MaxIter = 2000;系数_ = PPCA（Y，3， '选项'，选择）;

数据类型：结构体

输出参数

全部折叠

`_系数`-主成分系数
p-通过-k矩阵

主成分系数，以a的形式返回p-通过-k矩阵。每一列的_系数包含一个主分量系数。列是在降序成分方差的顺序，pcvar。

`分数`- 主成分评分
n-通过-k矩阵

主成分得分，返回一个n-通过-k矩阵。行分数对应于观察，列对应于组件。

`pcvar`-主成分方差
列向量

主成分方差，它们的协方差矩阵的特征值Y，作为列向量返回。

`亩`- 估计平均
行向量

估计平均每个变量的Y，返回为行向量。

`v`- 各向同性剩余方差
标值

各向同性剩余方差，返回作为标量值。

`年代`-收敛的最终结果
结构体

收敛时的最终结果，作为包含以下字段的结构返回。

`W`	W在收敛。
`XEXP`	所估计的潜在变量的条件期望x。
`侦察`	重建的观测资料使用k主成分。这是输入数据的低维近似`Y`，等于`亩`+`分数`*`多项式系数的`。
`v`	剩余方差。
`RMSResid`	残差的均方根。
`NumIter`	迭代次数数。
`nloglk`	负对数似然函数值。

参考

[1]小费，m.e.和c.m.毕晓普。概率主成分分析。皇家统计学会期刊。B辑(统计方法)，第61卷第3期，1999年，第611-622页。

[2] Roweis，S.“EM算法PCA和SPCA”。在对神经信息处理系统的进步，1997年会论文集。第10卷(NIPS 1997)，麻州剑桥:麻省理工学院出版社，1998年，第626-632页。

[3]伊林，A.，和T.赖光。“实际措施，主成分分析的缺失值的存在。”j·马赫。学习。Res。。卷。11，2010年8月，第一九五七年至2000年。

另请参阅

PPCA

语法

描述

例子

执行概率主成分分析

更改终止条件的概率主成分分析

重构意见

结果收敛

输入参数

`Y`- - - - - -输入数据
n-通过-p矩阵

`K`- - - - - -主成分数
正整数值小于秩

名称 - 值对参数

`'W0'`- - - - - -初始值的W
随机值的矩阵（默认）|p-通过-k矩阵

`'V0'`- - - - - -残差的初始值
随机数（默认）|正标量值

`“选项”`- - - - - -对于迭代选项
结构体

输出参数

`_系数`-主成分系数
p-通过-k矩阵

`分数`- 主成分评分
n-通过-k矩阵

`pcvar`-主成分方差
列向量

`亩`- 估计平均
行向量

`v`- 各向同性剩余方差
标值

`年代`-收敛的最终结果
结构体

更多关于

概率主成分分析

参考

另请参阅

介绍了在R2013a

统计和机器学习工具箱文档

金宝app

掌握机器学习:用MATLAB逐步指导

PPCA

语法

描述

例子

执行概率主成分分析

更改终止条件的概率主成分分析

重构意见

结果收敛

输入参数

Y- - - - - -输入数据n-通过-p矩阵

K- - - - - -主成分数正整数值小于秩

名称 - 值对参数

'W0'- - - - - -初始值的W随机值的矩阵（默认）|p-通过-k矩阵

'V0'- - - - - -残差的初始值随机数（默认）|正标量值

“选项”- - - - - -对于迭代选项结构体

输出参数

_系数-主成分系数p-通过-k矩阵

分数- 主成分评分n-通过-k矩阵

pcvar-主成分方差列向量

亩- 估计平均行向量

v- 各向同性剩余方差标值

年代-收敛的最终结果结构体

更多关于

概率主成分分析

参考

另请参阅

介绍了在R2013a

统计和机器学习工具箱文档

金宝app

掌握机器学习:用MATLAB逐步指导

`Y`- - - - - -输入数据
n-通过-p矩阵

`K`- - - - - -主成分数
正整数值小于秩

`'W0'`- - - - - -初始值的W
随机值的矩阵（默认）|p-通过-k矩阵

`'V0'`- - - - - -残差的初始值
随机数（默认）|正标量值

`“选项”`- - - - - -对于迭代选项
结构体

`_系数`-主成分系数
p-通过-k矩阵

`分数`- 主成分评分
n-通过-k矩阵

`pcvar`-主成分方差
列向量

`亩`- 估计平均
行向量

`v`- 各向同性剩余方差
标值

`年代`-收敛的最终结果
结构体