使用拉普拉斯分数的无监督学习的排名特征gydF4y2Ba
列特征(变量)在gydF4y2BaidxgydF4y2Ba
= fsulaplacian (gydF4y2BaXgydF4y2Ba
)gydF4y2BaXgydF4y2Ba
使用gydF4y2Ba拉普拉斯算子的分数gydF4y2Ba.函数返回gydF4y2BaidxgydF4y2Ba
,它包含按特征重要性排序的特征指数。您可以使用gydF4y2BaidxgydF4y2Ba
为无监督学习选择重要特征。gydF4y2Ba
使用一个或多个名称-值对参数指定其他选项。例如,可以指定gydF4y2BaidxgydF4y2Ba
= fsulaplacian (gydF4y2BaXgydF4y2Ba
,gydF4y2Ba名称,值gydF4y2Ba
)gydF4y2Ba“NumNeighbors”,10gydF4y2Ba
创建一个gydF4y2Ba相似度图gydF4y2Ba使用10个最近的邻居。gydF4y2Ba
[gydF4y2Ba
也返回功能得分gydF4y2BaidxgydF4y2Ba
,gydF4y2Ba分数gydF4y2Ba
) = fsulaplacian (gydF4y2Ba___gydF4y2Ba)gydF4y2Ba分数gydF4y2Ba
,使用前面语法中的任何输入参数组合。评分值越大,说明对应的特征是重要的。gydF4y2Ba
加载示例数据。gydF4y2Ba
负载gydF4y2Ba电离层gydF4y2Ba
根据重要性对功能进行排序。gydF4y2Ba
[idx,分数]= fsulaplacian (X);gydF4y2Ba
创建功能重要性分数的条形图。gydF4y2Ba
栏(分数(idx))包含(gydF4y2Ba“功能等级”gydF4y2Ba) ylabel (gydF4y2Ba“功能重要性分数”gydF4y2Ba)gydF4y2Ba
选择最重要的五个功能。中找到这些特性的列gydF4y2BaXgydF4y2Ba
.gydF4y2Ba
idx (1:5)gydF4y2Ba
ans =gydF4y2Ba1×5gydF4y2Ba15 13 17 21 19gydF4y2Ba
第15列gydF4y2BaXgydF4y2Ba
是最重要的特征。gydF4y2Ba
从Fisher的虹膜数据集计算一个相似矩阵,并使用相似矩阵对特征进行排序。gydF4y2Ba
载入费雪的虹膜数据集。gydF4y2Ba
负载gydF4y2BafisheririsgydF4y2Ba
找出每对观测之间的距离gydF4y2Ba量gydF4y2Ba
通过使用gydF4y2BapdistgydF4y2Ba
和gydF4y2BasquareformgydF4y2Ba
函数具有默认的欧式距离度量。gydF4y2Ba
D = pdist(量);Z = squareform (D);gydF4y2Ba
构造相似矩阵并确认其对称。gydF4y2Ba
S = exp (- z ^ 2);issymmetric (S)gydF4y2Ba
ans =gydF4y2Ba逻辑gydF4y2Ba1gydF4y2Ba
排名的功能。gydF4y2Ba
idx = fsulaplacian(量,gydF4y2Ba“相似”gydF4y2Ba,年代)gydF4y2Ba
idx =gydF4y2Ba1×4gydF4y2Ba3 4 1 2gydF4y2Ba
使用相似度矩阵排序gydF4y2Ba年代gydF4y2Ba
是否与指定排序相同gydF4y2Ba“NumNeighbors”gydF4y2Ba
作为gydF4y2Ba尺寸(量,1)gydF4y2Ba
.gydF4y2Ba
idx2 = fsulaplacian(量,gydF4y2Ba“NumNeighbors”gydF4y2Ba、尺寸(量,1))gydF4y2Ba
idx2 =gydF4y2Ba1×4gydF4y2Ba3 4 1 2gydF4y2Ba
XgydF4y2Ba
- - - - - -gydF4y2Ba输入数据gydF4y2Ba输入数据,指定为gydF4y2BangydF4y2Ba——- - - - - -gydF4y2BapgydF4y2Ba数字矩阵。的行gydF4y2BaXgydF4y2Ba
对应观察值(或点),列对应特征。gydF4y2Ba
该软件将gydF4y2Ba南gydF4y2Ba
年代gydF4y2BaXgydF4y2Ba
表示丢失的数据,并忽略gydF4y2BaXgydF4y2Ba
包含至少一个gydF4y2Ba南gydF4y2Ba
.gydF4y2Ba
数据类型:gydF4y2Ba单gydF4y2Ba
|gydF4y2Ba双gydF4y2Ba
指定可选的逗号分隔的对gydF4y2Ba名称,值gydF4y2Ba
参数。gydF4y2Ba的名字gydF4y2Ba
参数名和gydF4y2Ba价值gydF4y2Ba
为对应值。gydF4y2Ba的名字gydF4y2Ba
必须出现在引号内。可以以任意顺序指定多个名称和值对参数gydF4y2BaName1, Value1,…,的家gydF4y2Ba
.gydF4y2Ba
“NumNeighbors”10“KernelScale”、“汽车”gydF4y2Ba
指定最近邻数为10,核比例因子为gydF4y2Ba“汽车”gydF4y2Ba
.gydF4y2Ba
相似gydF4y2Ba
- - - - - -gydF4y2Ba相似度矩阵gydF4y2Ba[]gydF4y2Ba
(空矩阵)gydF4y2Ba(默认)|gydF4y2Ba对称矩阵gydF4y2Ba相似性矩阵,指定为逗号分隔对,由gydF4y2Ba“相似”gydF4y2Ba
和一个gydF4y2BangydF4y2Ba——- - - - - -gydF4y2BangydF4y2Ba对称矩阵,gydF4y2BangydF4y2Ba为观察次数。相似性矩阵(或邻接矩阵)通过建模数据点之间的局部邻域关系来表示输入数据。相似性矩阵中的值表示在a中连接的节点(数据点)之间的边(或连接)gydF4y2Ba相似度图gydF4y2Ba.有关更多信息,请参见gydF4y2Ba相似度矩阵gydF4y2Ba.gydF4y2Ba
如果指定gydF4y2Ba“相似”gydF4y2Ba
值,则不能指定任何其他名称-值对参数。如果不指定gydF4y2Ba“相似”gydF4y2Ba
值,然后软件使用其他名称-值对参数指定的选项计算一个相似矩阵。gydF4y2Ba
数据类型:gydF4y2Ba单gydF4y2Ba
|gydF4y2Ba双gydF4y2Ba
距离gydF4y2Ba
- - - - - -gydF4y2Ba距离度量gydF4y2Ba距离度量,指定为逗号分隔对,由gydF4y2Ba“距离”gydF4y2Ba
以及字符向量、字符串标量或函数句柄,如本表所述。gydF4y2Ba
价值gydF4y2Ba | 描述gydF4y2Ba |
---|---|
“欧几里得”gydF4y2Ba |
欧氏距离(默认)gydF4y2Ba |
“seuclidean”gydF4y2Ba |
标准化的欧氏距离。观测值之间的每个坐标差通过除以由此计算的标准偏差的相应元素来缩放gydF4y2Ba |
“mahalanobis”gydF4y2Ba |
马氏距离的样本协方差gydF4y2Ba |
“cityblock”gydF4y2Ba |
城市街区的距离gydF4y2Ba |
闵可夫斯基的gydF4y2Ba |
闵可夫斯基距离。默认指数是2。使用gydF4y2Ba |
“chebychev”gydF4y2Ba |
切比切夫距离(最大坐标差)gydF4y2Ba |
的余弦gydF4y2Ba |
1减去观测值之间夹角的余弦值(作为矢量处理)gydF4y2Ba |
“相关”gydF4y2Ba |
1减去观察值之间的样本相关性(作为值的序列处理)gydF4y2Ba |
“汉明”gydF4y2Ba |
汉明距离,是坐标差的百分比gydF4y2Ba |
“jaccard”gydF4y2Ba |
1减去雅卡尔系数,雅卡尔系数是不同的非零坐标的百分比gydF4y2Ba |
“枪兵”gydF4y2Ba |
1减去观察值之间的样本斯皮尔曼等级相关性(作为值的序列处理)gydF4y2Ba |
@gydF4y2Ba |
自定义距离功能手柄。距离函数有这样的形式gydF4y2Ba 函数gydF4y2BaZJ D2 = distfun(子)gydF4y2Ba距离计算%gydF4y2Ba...gydF4y2Ba
如果数据不是稀疏的,通常可以使用内置距离而不是函数句柄更快地计算距离。gydF4y2Ba |
有关更多信息,请参见gydF4y2Ba距离度量gydF4y2Ba.gydF4y2Ba
当你使用gydF4y2Ba“seuclidean”gydF4y2Ba
,gydF4y2Ba闵可夫斯基的gydF4y2Ba
,或gydF4y2Ba“mahalanobis”gydF4y2Ba
距离度量,您可以指定附加的名称-值对参数gydF4y2Ba“规模”gydF4y2Ba
,gydF4y2Ba“P”gydF4y2Ba
,或gydF4y2Ba“浸”gydF4y2Ba
,以控制距离度量。gydF4y2Ba
例子:gydF4y2Ba“距离”、“闵可夫斯基”,“P”3gydF4y2Ba
指定使用指数为的闵可夫斯基距离度量gydF4y2Ba3.gydF4y2Ba
.gydF4y2Ba
PgydF4y2Ba
- - - - - -gydF4y2Ba闵可夫斯基距离度量的指数gydF4y2Ba2gydF4y2Ba
(默认)|gydF4y2Ba积极的标量gydF4y2Ba闵可夫斯基距离度量的指数,指定为逗号分隔对,由gydF4y2Ba“P”gydF4y2Ba
一个正标量。gydF4y2Ba
此参数仅当gydF4y2Ba“距离”gydF4y2Ba
是gydF4y2Ba闵可夫斯基的gydF4y2Ba
.gydF4y2Ba
例子:gydF4y2Ba“P”3gydF4y2Ba
数据类型:gydF4y2Ba单gydF4y2Ba
|gydF4y2Ba双gydF4y2Ba
浸gydF4y2Ba
- - - - - -gydF4y2Ba马氏距离度量的协方差矩阵gydF4y2BaX (X, omitrows)gydF4y2Ba
(默认)|gydF4y2Ba正定矩阵gydF4y2Ba马氏距离度量的协方差矩阵,指定为逗号分隔对,由gydF4y2Ba“浸”gydF4y2Ba
一个正定矩阵。gydF4y2Ba
此参数仅当gydF4y2Ba“距离”gydF4y2Ba
是gydF4y2Ba“mahalanobis”gydF4y2Ba
.gydF4y2Ba
例子:gydF4y2Ba“浸”,眼睛(4)gydF4y2Ba
数据类型:gydF4y2Ba单gydF4y2Ba
|gydF4y2Ba双gydF4y2Ba
规模gydF4y2Ba
- - - - - -gydF4y2Ba标准欧几里得距离度量的比例因子gydF4y2Ba性病(X, omitnan)gydF4y2Ba
(默认)|gydF4y2Ba非负值的数值向量gydF4y2Ba标准欧几里得距离度量的缩放因子,指定为逗号分隔对组成gydF4y2Ba“规模”gydF4y2Ba
和一个非负值的数值向量。gydF4y2Ba
规模gydF4y2Ba
长度gydF4y2BapgydF4y2Ba(列的数目gydF4y2BaXgydF4y2Ba
),因为每个维度(列)gydF4y2BaXgydF4y2Ba
在?中有相应的值gydF4y2Ba规模gydF4y2Ba
.对于每个维度gydF4y2BaXgydF4y2Ba
,gydF4y2BafsulaplaciangydF4y2Ba
使用中对应的值gydF4y2Ba规模gydF4y2Ba
使观察结果之间的差异标准化。gydF4y2Ba
此参数仅当gydF4y2Ba“距离”gydF4y2Ba
是gydF4y2Ba“seuclidean”gydF4y2Ba
.gydF4y2Ba
数据类型:gydF4y2Ba单gydF4y2Ba
|gydF4y2Ba双gydF4y2Ba
NumNeighborsgydF4y2Ba
- - - - - -gydF4y2Ba最近邻数gydF4y2Ba日志(大小(X, 1))gydF4y2Ba
(默认)|gydF4y2Ba正整数gydF4y2Ba用来构造相似图的最近邻的数目,指定为逗号分隔对组成gydF4y2Ba“NumNeighbors”gydF4y2Ba
一个正整数。gydF4y2Ba
例子:gydF4y2Ba“NumNeighbors”,10gydF4y2Ba
数据类型:gydF4y2Ba单gydF4y2Ba
|gydF4y2Ba双gydF4y2Ba
KernelScalegydF4y2Ba
- - - - - -gydF4y2Ba比例因子gydF4y2Ba1gydF4y2Ba
(默认)|gydF4y2Ba“汽车”gydF4y2Ba
|gydF4y2Ba积极的标量gydF4y2Ba内核的比例因子,指定为逗号分隔对,由gydF4y2Ba“KernelScale”gydF4y2Ba
和gydF4y2Ba“汽车”gydF4y2Ba
或者一个正标量。该软件使用比例因子将距离转换为相似性度量。有关更多信息,请参见gydF4y2Ba相似度图gydF4y2Ba.gydF4y2Ba
的gydF4y2Ba“汽车”gydF4y2Ba
选项仅支持金宝appgydF4y2Ba“欧几里得”gydF4y2Ba
和gydF4y2Ba“seuclidean”gydF4y2Ba
距离度量。gydF4y2Ba
如果您指定gydF4y2Ba“汽车”gydF4y2Ba
,采用启发式方法选择合适的比例因子。这个启发式过程使用子抽样,因此估计值可能因调用而异。要复制结果,使用随机数种子gydF4y2BarnggydF4y2Ba
在调用之前gydF4y2BafsulaplaciangydF4y2Ba
.gydF4y2Ba
例子:gydF4y2Ba“KernelScale”、“汽车”gydF4y2Ba
idxgydF4y2Ba
-按特征重要性排序的特征指数gydF4y2Ba中特征的指数gydF4y2BaXgydF4y2Ba
按特性重要性排序,返回为数字向量。例如,如果gydF4y2Baidx (3)gydF4y2Ba
是gydF4y2Ba5gydF4y2Ba
,第三个最重要的特征是第五列gydF4y2BaXgydF4y2Ba
.gydF4y2Ba
分数gydF4y2Ba
——功能得分gydF4y2Ba特征值,作为数字向量返回。一个很大的分数值gydF4y2Ba分数gydF4y2Ba
表示对应的特性是重要的。中的值gydF4y2Ba分数gydF4y2Ba
有相同的顺序的功能gydF4y2BaXgydF4y2Ba
.gydF4y2Ba
相似图模型的数据点之间的局部邻域关系gydF4y2BaXgydF4y2Ba
作为一个无向图。图中的节点表示数据点,而无方向的边表示数据点之间的连接。gydF4y2Ba
如果成对的距离gydF4y2Ba经销gydF4y2Ba我,我gydF4y2Ba任意两个节点之间gydF4y2Ba我gydF4y2Ba和gydF4y2BajgydF4y2Ba为正(或大于某一阈值),则相似图使用边将两个节点连接起来gydF4y2Ba[2]gydF4y2Ba.两个节点之间的边由两两相似度加权gydF4y2Ba年代gydF4y2Ba我,我gydF4y2Ba,在那里gydF4y2Ba ,用于指定的内核规模gydF4y2BaσgydF4y2Ba价值。gydF4y2Ba
fsulaplaciangydF4y2Ba
使用最近邻方法构造一个相似图。函数将点连接起来gydF4y2BaXgydF4y2Ba
最近的邻居。使用gydF4y2Ba“NumNeighbors”gydF4y2Ba
指定最近邻居的数目。gydF4y2Ba
相似矩阵是A的矩阵表示gydF4y2Ba相似度图gydF4y2Ba.的gydF4y2BangydF4y2Ba——- - - - - -gydF4y2BangydF4y2Ba矩阵gydF4y2Ba 包含相似图中连接节点之间的成对相似值。图的相似矩阵也称为邻接矩阵。gydF4y2Ba
相似性矩阵是对称的,因为相似图的边是无方向的。的值gydF4y2Ba年代gydF4y2Ba我,我gydF4y2Ba= 0gydF4y2Ba
意味着节点gydF4y2Ba我gydF4y2Ba和gydF4y2BajgydF4y2Ba相似图之间是不连通的。gydF4y2Ba
度矩阵gydF4y2BaDgydF4y2BaggydF4y2Ba是一个gydF4y2BangydF4y2Ba——- - - - - -gydF4y2BangydF4y2Ba矩阵的行求和得到的对角矩阵gydF4y2Ba相似度矩阵gydF4y2Ba年代gydF4y2Ba.也就是说,gydF4y2Ba我gydF4y2Ba的第Th对角元素gydF4y2BaDgydF4y2BaggydF4y2Ba是gydF4y2Ba
拉普拉斯矩阵,这是表示A的一种方法gydF4y2Ba相似度图gydF4y2Ba,被定义为gydF4y2Ba度矩阵gydF4y2BaDgydF4y2BaggydF4y2Ba和gydF4y2Ba相似度矩阵gydF4y2Ba年代gydF4y2Ba.gydF4y2Ba
的gydF4y2BafsulaplaciangydF4y2Ba
函数使用拉普拉斯分数对特征进行排序gydF4y2Ba[1]gydF4y2Ba从最近的邻居那里得到的gydF4y2Ba相似度图gydF4y2Ba.gydF4y2Ba
fsulaplaciangydF4y2Ba
计算中的值gydF4y2Ba分数gydF4y2Ba
如下:gydF4y2Ba
对于每个数据点gydF4y2BaXgydF4y2Ba
,使用最近邻法定义局部邻域,并求成对距离gydF4y2Ba
对所有点gydF4y2Ba我gydF4y2Ba和gydF4y2BajgydF4y2Ba在附近。gydF4y2Ba
将距离转换为gydF4y2Ba相似度矩阵gydF4y2Ba年代gydF4y2Ba使用核变换gydF4y2Ba
,在那里gydF4y2BaσgydF4y2Ba内核的比例因子是否如指定的gydF4y2Ba“KernelScale”gydF4y2Ba
名称-值对的论点。gydF4y2Ba
通过去除每个特征的平均值使其居中。gydF4y2Ba
在哪里gydF4y2BaxgydF4y2BargydF4y2Ba是gydF4y2BargydF4y2Bath特性,gydF4y2BaDgydF4y2BaggydF4y2Ba是gydF4y2Ba度矩阵gydF4y2Ba,gydF4y2Ba .gydF4y2Ba
计算分数gydF4y2Ba年代gydF4y2BargydF4y2Ba为每个特性。gydF4y2Ba
请注意,gydF4y2Ba[1]gydF4y2Ba定义拉普拉斯分数为gydF4y2Ba
在哪里gydF4y2BalgydF4y2Ba是gydF4y2Ba拉普拉斯算子的矩阵gydF4y2Ba的区别gydF4y2BaDgydF4y2BaggydF4y2Ba和gydF4y2Ba年代gydF4y2Ba.的gydF4y2BafsulaplaciangydF4y2Ba
函数仅使用该方程的第二项来表示的得分值gydF4y2Ba分数gydF4y2Ba
因此,一个大的分数值表明一个重要的特征。gydF4y2Ba
使用拉普拉斯分数选择特征与最小化值是一致的gydF4y2Ba
在哪里gydF4y2BaxgydF4y2Ba红外gydF4y2Ba代表了gydF4y2Ba我gydF4y2Ba观测gydF4y2BargydF4y2Bath特性。最小化这个值意味着算法更倾向于具有较大方差的特征。同时,算法假设一个重要特征的两个数据点是相近的,当且仅当相似图中两个数据点之间有一条边。gydF4y2Ba
他,X., D. Cai, P. Niyogi。"特征选择的拉普拉斯分值"gydF4y2Ba少量的程序。gydF4y2Ba2005.gydF4y2Ba
[2] Von Luxburg, U.《光谱聚类教程》gydF4y2Ba统计与计算杂志gydF4y2Ba.Vol.17, no . 4, 2007, pp. 395-416。gydF4y2Ba
你点击一个链接对应于这个MATLAB命令:gydF4y2Ba
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝appgydF4y2Ba
选择一个网站,在那里获得翻译的内容,并看到当地的活动和优惠。根据您的位置,我们建议您选择:gydF4y2Ba.gydF4y2Ba
选择gydF4y2Ba网站gydF4y2Ba你也可以从以下列表中选择一个网站:gydF4y2Ba
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。gydF4y2Ba