使用拉普拉斯分数无监督学习的等级功能G.ydF4y2Ba
排名特征(变量)G.ydF4y2BaidxG.ydF4y2Ba
= fsulaplacian(G.ydF4y2BaX.G.ydF4y2Ba
)G.ydF4y2BaX.G.ydF4y2Ba
使用G.ydF4y2Ba拉普拉斯分数G.ydF4y2Ba.函数返回G.ydF4y2BaidxG.ydF4y2Ba
,其中包含通过特征重要性订购的功能指标。你可以使用G.ydF4y2BaidxG.ydF4y2Ba
为无监督学习选择重要特征。G.ydF4y2Ba
使用一个或多个名称-值对参数指定其他选项。例如,可以指定G.ydF4y2BaidxG.ydF4y2Ba
= fsulaplacian(G.ydF4y2BaX.G.ydF4y2Ba
那G.ydF4y2Ba名称,价值G.ydF4y2Ba
)G.ydF4y2Ba'numneighbors',10G.ydF4y2Ba
创建一个G.ydF4y2Ba相似度图G.ydF4y2Ba使用10个最近的邻居。G.ydF4y2Ba
[G.ydF4y2Ba
还返回特征分数G.ydF4y2BaidxG.ydF4y2Ba
那G.ydF4y2Ba分数G.ydF4y2Ba
) = fsulaplacian (G.ydF4y2Ba___G.ydF4y2Ba)G.ydF4y2Ba分数G.ydF4y2Ba
,使用前面语法中的任何输入参数组合。评分值越大,说明对应的特征是重要的。G.ydF4y2Ba
加载示例数据。G.ydF4y2Ba
加载G.ydF4y2Ba电离层G.ydF4y2Ba
根据重要性排列功能。G.ydF4y2Ba
[Idx,scores] = fsulaplacian(x);G.ydF4y2Ba
创建一个特征重要分数的条形图。G.ydF4y2Ba
BAR(分数(IDX))XLABEL(G.ydF4y2Ba“功能等级”G.ydF4y2Ba) ylabel (G.ydF4y2Ba“功能重要性分数”G.ydF4y2Ba)G.ydF4y2Ba
选择最重要的五个功能。找到这些功能的列G.ydF4y2BaX.G.ydF4y2Ba
.G.ydF4y2Ba
idx (1:5)G.ydF4y2Ba
ans =.G.ydF4y2Ba1×5G.ydF4y2Ba15 13 13 17 21 19G.ydF4y2Ba
第15列G.ydF4y2BaX.G.ydF4y2Ba
是最重要的功能。G.ydF4y2Ba
从Fisher的虹膜数据集计算一个相似矩阵,并使用相似矩阵对特征进行排序。G.ydF4y2Ba
装载Fisher的Iris数据集。G.ydF4y2Ba
加载G.ydF4y2Ba渔民G.ydF4y2Ba
找到每对观察之间的距离G.ydF4y2Ba测定G.ydF4y2Ba
通过使用G.ydF4y2BaPdist.G.ydF4y2Ba
和G.ydF4y2Ba方形G.ydF4y2Ba
默认欧几里德距离度量的功能。G.ydF4y2Ba
D = PDIST(MEA);z =方形格式(d);G.ydF4y2Ba
构建相似性矩阵并确认它是对称的。G.ydF4y2Ba
s = exp(-Z. ^ 2);不良G.ydF4y2Ba
ans =.G.ydF4y2Ba逻辑G.ydF4y2Ba1G.ydF4y2Ba
排名的功能。G.ydF4y2Ba
Idx = fsulaplacian(meas,G.ydF4y2Ba'相似'G.ydF4y2Ba,s)G.ydF4y2Ba
idx =G.ydF4y2Ba1×4G.ydF4y2Ba3 4 1 2G.ydF4y2Ba
使用相似性矩阵排名G.ydF4y2BaS.G.ydF4y2Ba
通过指定等级是相同的G.ydF4y2Ba'numneighbors'G.ydF4y2Ba
as.G.ydF4y2Ba尺寸(量,1)G.ydF4y2Ba
.G.ydF4y2Ba
idx2 = fsulaplacian(meas,G.ydF4y2Ba'numneighbors'G.ydF4y2Ba、尺寸(量,1))G.ydF4y2Ba
idx2 =G.ydF4y2Ba1×4G.ydF4y2Ba3 4 1 2G.ydF4y2Ba
X.G.ydF4y2Ba
-G.ydF4y2Ba输入数据G.ydF4y2Ba输入数据,指定为G.ydF4y2BaNG.ydF4y2Ba-G.ydF4y2BaP.G.ydF4y2Ba数字矩阵。行的行G.ydF4y2BaX.G.ydF4y2Ba
对应于观察(或点),并且列对应于特征。G.ydF4y2Ba
软件对待G.ydF4y2Ba南G.ydF4y2Ba
in.G.ydF4y2BaX.G.ydF4y2Ba
作为缺少数据并忽略任何行G.ydF4y2BaX.G.ydF4y2Ba
包含至少一个G.ydF4y2Ba南G.ydF4y2Ba
.G.ydF4y2Ba
数据类型:G.ydF4y2Ba单G.ydF4y2Ba
|G.ydF4y2Ba双人间G.ydF4y2Ba
指定可选的逗号分离对G.ydF4y2Ba名称,价值G.ydF4y2Ba
论点。G.ydF4y2Ba的名字G.ydF4y2Ba
是参数名称和G.ydF4y2Ba价值G.ydF4y2Ba
为对应值。G.ydF4y2Ba的名字G.ydF4y2Ba
必须出现在引号内。您可以以任何顺序指定多个名称和值对参数G.ydF4y2Baname1,value1,...,namen,valuenG.ydF4y2Ba
.G.ydF4y2Ba
“NumNeighbors”10“KernelScale”、“汽车”G.ydF4y2Ba
指定最近邻居的数量和核心尺度因子G.ydF4y2Ba'auto'G.ydF4y2Ba
.G.ydF4y2Ba
'相似'G.ydF4y2Ba
-G.ydF4y2Ba相似性矩阵G.ydF4y2Ba[]G.ydF4y2Ba
(空矩阵)G.ydF4y2Ba(默认)|G.ydF4y2Ba对称矩阵G.ydF4y2Ba相似性矩阵,指定为逗号分隔的对组成G.ydF4y2Ba'相似'G.ydF4y2Ba
和一个G.ydF4y2BaNG.ydF4y2Ba-G.ydF4y2BaNG.ydF4y2Ba对称矩阵,其中G.ydF4y2BaNG.ydF4y2Ba为观察次数。相似性矩阵(或邻接矩阵)通过建模数据点之间的局部邻域关系来表示输入数据。相似性矩阵中的值表示在a中连接的节点(数据点)之间的边(或连接)G.ydF4y2Ba相似度图G.ydF4y2Ba.有关更多信息,请参见G.ydF4y2Ba相似度矩阵G.ydF4y2Ba.G.ydF4y2Ba
如果您指定了G.ydF4y2Ba'相似'G.ydF4y2Ba
值,然后您无法指定任何其他名称值对参数。如果您没有指定G.ydF4y2Ba'相似'G.ydF4y2Ba
值,然后软件使用其他名称-值对参数指定的选项计算一个相似矩阵。G.ydF4y2Ba
数据类型:G.ydF4y2Ba单G.ydF4y2Ba
|G.ydF4y2Ba双人间G.ydF4y2Ba
“距离”G.ydF4y2Ba
-G.ydF4y2Ba距离度量G.ydF4y2Ba距离度量,指定为逗号分隔对,由G.ydF4y2Ba“距离”G.ydF4y2Ba
以及字符向量、字符串标量或函数句柄,如本表所述。G.ydF4y2Ba
价值G.ydF4y2Ba | 描述G.ydF4y2Ba |
---|---|
'euclidean'G.ydF4y2Ba |
欧氏距离(默认)G.ydF4y2Ba |
“seuclidean”G.ydF4y2Ba |
标准化的欧氏距离。观测值之间的每个坐标差通过除以由此计算的标准偏差的相应元素来缩放G.ydF4y2Ba |
'mahalanobis'G.ydF4y2Ba |
使用样本协方差的Mahalanobis距离G.ydF4y2Ba |
“cityblock”G.ydF4y2Ba |
城市街区距离G.ydF4y2Ba |
'minkowski'G.ydF4y2Ba |
闵可夫斯基距离。默认指数是2。使用G.ydF4y2Ba |
'chebbychev'G.ydF4y2Ba |
Chebychev距离(最大坐标差异)G.ydF4y2Ba |
'余弦'G.ydF4y2Ba |
一个减去观察之间夹持角度的余弦(作为载体处理)G.ydF4y2Ba |
'相关'G.ydF4y2Ba |
一个减去观察之间的样本相关性(视为值序列)G.ydF4y2Ba |
'汉明'G.ydF4y2Ba |
汉明距离,是坐标差的百分比G.ydF4y2Ba |
'jaccard'G.ydF4y2Ba |
1减去雅卡尔系数,雅卡尔系数是不同的非零坐标的百分比G.ydF4y2Ba |
“枪兵”G.ydF4y2Ba |
1减去观察值之间的样本斯皮尔曼等级相关性(作为值的序列处理)G.ydF4y2Ba |
@G.ydF4y2Ba |
自定义距离功能句柄。距离功能具有表单G.ydF4y2Ba 函数G.ydF4y2Bad2 = distfun(zi,zj)G.ydF4y2Ba%计算距离G.ydF4y2Ba...G.ydF4y2Ba
如果数据不是稀疏的,通常可以使用内置距离而不是函数句柄更快地计算距离。G.ydF4y2Ba |
有关更多信息,请参见G.ydF4y2Ba距离指标G.ydF4y2Ba.G.ydF4y2Ba
当你使用的时候G.ydF4y2Ba“seuclidean”G.ydF4y2Ba
那G.ydF4y2Ba'minkowski'G.ydF4y2Ba
,或G.ydF4y2Ba'mahalanobis'G.ydF4y2Ba
距离度量,您可以指定附加的名称-值对参数G.ydF4y2Ba“规模”G.ydF4y2Ba
那G.ydF4y2Ba'P'G.ydF4y2Ba
,或G.ydF4y2Ba'COV'G.ydF4y2Ba
分别控制距离指标。G.ydF4y2Ba
示例:G.ydF4y2Ba“距离”、“闵可夫斯基”,“P”3G.ydF4y2Ba
指定使用带有指数的Minkowski距离度量G.ydF4y2Ba3.G.ydF4y2Ba
.G.ydF4y2Ba
'P'G.ydF4y2Ba
-G.ydF4y2Ba用于Minkowski距离度量的指数G.ydF4y2Ba2G.ydF4y2Ba
(默认)|G.ydF4y2Ba正标量G.ydF4y2Ba用于Minkowski距离度量的指数,指定为逗号分隔对组成G.ydF4y2Ba'P'G.ydF4y2Ba
一个正标量。G.ydF4y2Ba
此参数仅当G.ydF4y2Ba“距离”G.ydF4y2Ba
是G.ydF4y2Ba'minkowski'G.ydF4y2Ba
.G.ydF4y2Ba
示例:G.ydF4y2Ba'P',3G.ydF4y2Ba
数据类型:G.ydF4y2Ba单G.ydF4y2Ba
|G.ydF4y2Ba双人间G.ydF4y2Ba
'COV'G.ydF4y2Ba
-G.ydF4y2Ba马氏距离度量的协方差矩阵G.ydF4y2BaCOV(x,'omitrows')G.ydF4y2Ba
(默认)|G.ydF4y2Ba正定的矩阵G.ydF4y2Ba用于Mahalanobis距离度量的协方差矩阵,指定为逗号分隔对组成G.ydF4y2Ba'COV'G.ydF4y2Ba
一个正定矩阵。G.ydF4y2Ba
此参数仅当G.ydF4y2Ba“距离”G.ydF4y2Ba
是G.ydF4y2Ba'mahalanobis'G.ydF4y2Ba
.G.ydF4y2Ba
示例:G.ydF4y2Ba'COV',EYE(4)G.ydF4y2Ba
数据类型:G.ydF4y2Ba单G.ydF4y2Ba
|G.ydF4y2Ba双人间G.ydF4y2Ba
“规模”G.ydF4y2Ba
-G.ydF4y2Ba标准欧几里得距离度量的比例因子G.ydF4y2Bastd(x,'omitnan')G.ydF4y2Ba
(默认)|G.ydF4y2Ba非负值的数字矢量G.ydF4y2Ba标准化欧几里德距离度量的缩放因子指定为逗号分隔对G.ydF4y2Ba“规模”G.ydF4y2Ba
和一个非负值的数值向量。G.ydF4y2Ba
规模G.ydF4y2Ba
有长度G.ydF4y2BaP.G.ydF4y2Ba(列的数目G.ydF4y2BaX.G.ydF4y2Ba
),因为每个维度(列)G.ydF4y2BaX.G.ydF4y2Ba
有相应的价值G.ydF4y2Ba规模G.ydF4y2Ba
.对于每个维度G.ydF4y2BaX.G.ydF4y2Ba
那G.ydF4y2Bafsulaplacian.G.ydF4y2Ba
使用中对应的值G.ydF4y2Ba规模G.ydF4y2Ba
标准化观察之间的差异。G.ydF4y2Ba
此参数仅当G.ydF4y2Ba“距离”G.ydF4y2Ba
是G.ydF4y2Ba“seuclidean”G.ydF4y2Ba
.G.ydF4y2Ba
数据类型:G.ydF4y2Ba单G.ydF4y2Ba
|G.ydF4y2Ba双人间G.ydF4y2Ba
'numneighbors'G.ydF4y2Ba
-G.ydF4y2Ba最近邻居的数量G.ydF4y2Ba日志(大小(x,1))G.ydF4y2Ba
(默认)|G.ydF4y2Ba正整数G.ydF4y2Ba用于构造相似性图的最近邻居数量,指定为逗号分隔的对组成G.ydF4y2Ba'numneighbors'G.ydF4y2Ba
和一个正整数。G.ydF4y2Ba
示例:G.ydF4y2Ba'numneighbors',10G.ydF4y2Ba
数据类型:G.ydF4y2Ba单G.ydF4y2Ba
|G.ydF4y2Ba双人间G.ydF4y2Ba
'kernelscale'G.ydF4y2Ba
-G.ydF4y2Ba规模因子G.ydF4y2Ba1G.ydF4y2Ba
(默认)|G.ydF4y2Ba'auto'G.ydF4y2Ba
|G.ydF4y2Ba正标量G.ydF4y2Ba内核的规模因子,指定为逗号分隔对组成G.ydF4y2Ba'kernelscale'G.ydF4y2Ba
和G.ydF4y2Ba'auto'G.ydF4y2Ba
或者一个正标量。该软件使用比例因子将距离转换为相似性度量。有关更多信息,请参见G.ydF4y2Ba相似度图G.ydF4y2Ba.G.ydF4y2Ba
当G.ydF4y2Ba'auto'G.ydF4y2Ba
选项仅支持金宝appG.ydF4y2Ba'euclidean'G.ydF4y2Ba
和G.ydF4y2Ba“seuclidean”G.ydF4y2Ba
距离指标。G.ydF4y2Ba
如果您指定G.ydF4y2Ba'auto'G.ydF4y2Ba
然后,软件使用启发式程序选择适当的比例因子。这种启发式程序使用分列,因此估计可能因对另一个呼叫而异。要重现结果,请使用随机数种子G.ydF4y2BarngG.ydF4y2Ba
在打电话之前G.ydF4y2Bafsulaplacian.G.ydF4y2Ba
.G.ydF4y2Ba
示例:G.ydF4y2Ba'kernelscale','auto'G.ydF4y2Ba
idxG.ydF4y2Ba
-按特征重要性排序的特征指数G.ydF4y2Ba特征的指标G.ydF4y2BaX.G.ydF4y2Ba
按特征重要性订购,作为数字矢量返回。例如,如果G.ydF4y2BaIDX(3)G.ydF4y2Ba
是G.ydF4y2Ba5.G.ydF4y2Ba
,第三个最重要的特征是第五列G.ydF4y2BaX.G.ydF4y2Ba
.G.ydF4y2Ba
分数G.ydF4y2Ba
- 特征分数G.ydF4y2Ba特征值,作为数字向量返回。一个很大的分数值G.ydF4y2Ba分数G.ydF4y2Ba
表示对应的特性是重要的。中的值G.ydF4y2Ba分数G.ydF4y2Ba
有相同的顺序的功能G.ydF4y2BaX.G.ydF4y2Ba
.G.ydF4y2Ba
相似图模型的数据点之间的局部邻域关系G.ydF4y2BaX.G.ydF4y2Ba
作为一个无向图。图中的节点表示数据点,并且边缘的边缘表示数据点之间的连接。G.ydF4y2Ba
如果成对距离G.ydF4y2Ba经销G.ydF4y2Ba我,J.G.ydF4y2Ba在任何两个节点之间G.ydF4y2Ba我G.ydF4y2Ba和G.ydF4y2BajG.ydF4y2Ba是正(或大于某个阈值),那么相似性图使用边缘连接两个节点G.ydF4y2Ba[2]G.ydF4y2Ba.两个节点之间的边由两两相似度加权G.ydF4y2BaS.G.ydF4y2Ba我,J.G.ydF4y2Ba,在哪里G.ydF4y2Ba ,对于指定的内核标度G.ydF4y2Baσ.G.ydF4y2Ba价值。G.ydF4y2Ba
fsulaplacian.G.ydF4y2Ba
使用最接近的邻法构造相似图。该功能连接点G.ydF4y2BaX.G.ydF4y2Ba
这是最近的邻居。使用G.ydF4y2Ba'numneighbors'G.ydF4y2Ba
指定最近邻居的数量。G.ydF4y2Ba
相似矩阵是A的矩阵表示G.ydF4y2Ba相似度图G.ydF4y2Ba.当G.ydF4y2BaNG.ydF4y2Ba-G.ydF4y2BaNG.ydF4y2Ba矩阵G.ydF4y2Ba 包含相似图中的连接节点之间的成对相似值。图的相似性矩阵也称为邻接矩阵。G.ydF4y2Ba
相似性矩阵是对称的,因为相似性图的边缘是无缝的。价值G.ydF4y2BaS.G.ydF4y2Ba我,J.G.ydF4y2Ba= 0.G.ydF4y2Ba
意味着节点G.ydF4y2Ba我G.ydF4y2Ba和G.ydF4y2BajG.ydF4y2Ba相似图之间是不连通的。G.ydF4y2Ba
学位矩阵G.ydF4y2BaD.G.ydF4y2BaG.G.ydF4y2Ba是一个G.ydF4y2BaNG.ydF4y2Ba-G.ydF4y2BaNG.ydF4y2Ba矩阵的行求和得到的对角矩阵G.ydF4y2Ba相似度矩阵G.ydF4y2BaS.G.ydF4y2Ba.也就是说,G.ydF4y2Ba我G.ydF4y2BaTH对角线元素G.ydF4y2BaD.G.ydF4y2BaG.G.ydF4y2Ba是G.ydF4y2Ba
拉普拉斯矩阵,这是表示A的一种方法G.ydF4y2Ba相似度图G.ydF4y2Ba,被定义为之间的差异G.ydF4y2Ba学位矩阵G.ydF4y2BaD.G.ydF4y2BaG.G.ydF4y2Ba和G.ydF4y2Ba相似度矩阵G.ydF4y2BaS.G.ydF4y2Ba.G.ydF4y2Ba
当G.ydF4y2Bafsulaplacian.G.ydF4y2Ba
使用Laplacian分数来排名功能G.ydF4y2Ba[1]G.ydF4y2Ba从最近的邻居获得G.ydF4y2Ba相似度图G.ydF4y2Ba.G.ydF4y2Ba
fsulaplacian.G.ydF4y2Ba
计算中的值G.ydF4y2Ba分数G.ydF4y2Ba
如下:G.ydF4y2Ba
对于每个数据点G.ydF4y2BaX.G.ydF4y2Ba
,使用最近邻法定义局部邻域,并求成对距离G.ydF4y2Ba
对于所有要点G.ydF4y2Ba我G.ydF4y2Ba和G.ydF4y2BajG.ydF4y2Ba在邻居。G.ydF4y2Ba
将距离转换为G.ydF4y2Ba相似度矩阵G.ydF4y2BaS.G.ydF4y2Ba使用内核转换G.ydF4y2Ba
,在哪里G.ydF4y2Baσ.G.ydF4y2Ba是核心的规模因素,如所指定的内核G.ydF4y2Ba'kernelscale'G.ydF4y2Ba
名称值对参数。G.ydF4y2Ba
通过删除其平均值来中心。G.ydF4y2Ba
在哪里G.ydF4y2BaX.G.ydF4y2BaR.G.ydF4y2Ba是G.ydF4y2BaR.G.ydF4y2Ba特征,G.ydF4y2BaD.G.ydF4y2BaG.G.ydF4y2Ba是G.ydF4y2Ba学位矩阵G.ydF4y2Ba,G.ydF4y2Ba .G.ydF4y2Ba
计算得分G.ydF4y2BaS.G.ydF4y2BaR.G.ydF4y2Ba对于每个特征。G.ydF4y2Ba
注意G.ydF4y2Ba[1]G.ydF4y2Ba定义Laplacian得分G.ydF4y2Ba
在哪里G.ydF4y2BaL.G.ydF4y2Ba是G.ydF4y2Ba拉普拉斯算子的矩阵G.ydF4y2Ba,定义为之间的差异G.ydF4y2BaD.G.ydF4y2BaG.G.ydF4y2Ba和G.ydF4y2BaS.G.ydF4y2Ba.当G.ydF4y2Bafsulaplacian.G.ydF4y2Ba
函数仅使用此等式的第二项进行分数值G.ydF4y2Ba分数G.ydF4y2Ba
因此,大得分值表示一个重要的特征。G.ydF4y2Ba
使用拉普拉斯分数选择特征与最小化值是一致的G.ydF4y2Ba
在哪里G.ydF4y2BaX.G.ydF4y2BaIR.G.ydF4y2Ba代表了G.ydF4y2Ba我G.ydF4y2Ba观察G.ydF4y2BaR.G.ydF4y2Bath特性。最小化这个值意味着算法更倾向于具有较大方差的特征。同时,算法假设一个重要特征的两个数据点是相近的,当且仅当相似图中两个数据点之间有一条边。G.ydF4y2Ba
他,X., D. Cai, P. Niyogi。"特征选择的拉普拉斯分值"G.ydF4y2Banips程序。G.ydF4y2Ba2005年。G.ydF4y2Ba
[2] Von Luxburg,U.“频谱聚类的教程。”G.ydF4y2Ba统计与计算杂志G.ydF4y2Ba.Vol.17,第4,2007号,第395-416页。G.ydF4y2Ba
您单击了与此MATLAB命令对应的链接:G.ydF4y2Ba
在MATLAB命令窗口中输入它来运行命令。Web浏览器不支持MATLAB命令。金宝appG.ydF4y2Ba
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:G.ydF4y2Ba.G.ydF4y2Ba
选择G.ydF4y2Ba网站G.ydF4y2Ba您还可以从以下列表中选择一个网站:G.ydF4y2Ba
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。G.ydF4y2Ba