类别:特征选择回归
修正邻域成分分析(NCA)回归模型
mdlrefit =改装(mdl、名称、值)
mdl
- - - - - -邻域成分分析模型的回归特征选择回归
对象邻域成分分析模型或分类,指定为特征选择回归
对象
指定可选的逗号分隔的对名称、值
论据。的名字
参数名和价值
是对应的值。的名字
必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:名称1,值1,…,名称,值
.
“FitMethod”
- - - - - -模型拟合方法mdl.fit方法
(默认)|“准确”
|“没有”
|“平均”
模型拟合方法,指定为逗号分隔对组成“FitMethod”
下面是其中之一。
“准确”
-使用所有数据执行拟合。
“没有”
-无拟合。使用此选项可使用调用中提供的初始特征权重来评估NCA模型的泛化误差fsrnca
.
“平均”
-该函数将数据划分为多个分区(子集),并使用准确的
方法,并返回特征权重的平均值。您可以使用NumPartitions
名称-值对的论点。
例子:“FitMethod”和“none”
“λ”
- - - - - -正则化参数兰姆达
(默认)|非负的标量值正则化参数,指定为逗号分隔对,由“λ”
和一个非负标量值。
为n观察,最好的λ
将NCA模型的概化误差最小化的值预期为1/的倍数n
例子:“λ”,0.01
数据类型:双重的
|单
“解算器”
- - - - - -解算器类型mdl。解算器
(默认)|“lbfgs”
|“sgd”
|“小批量lbfgs”
用于估计特征权重的求解器类型,指定为由逗号分隔的对组成“解算器”
下面是其中之一。
“lbfgs”
-有限内存BFGS(Broyden-Fletcher-Goldfarb-Shanno)算法(LBFGS算法)
“sgd”
-随机梯度下降
“小批量lbfgs”
-随机梯度下降与LBFGS算法应用于小批量
例子:‘解算器’,‘minibatch-lbfgs’
“初始特征权重”
- - - - - -初始特征权重mdl。InitialFeatureWeights
(默认)|p实正标量值的-乘1向量初始特征权重,指定为逗号分隔对,由“初始特征权重”
和p-实正标量值的x-1向量。
数据类型:双重的
|单
“冗长”
- - - - - -冗长级别的指示符冗长的
(默认)|0|1|>1收敛摘要显示的详细程度指示符,指定为由逗号分隔的对组成“冗长”
下面是其中之一。
0-无收敛性摘要
1 -收敛总结,包括迭代次数、梯度范数、目标函数值。
>1-更多收敛信息取决于拟合算法
使用解算器时“小批量lbfgs”
和详细级>1,收敛信息包括中间小批LBFGS拟合的迭代日志。
例子:“详细”,2
数据类型:双重的
|单
“梯度公差”
- - - - - -相对收敛容限mdl。GradientTolerance
(默认)|正实标量值求解器梯度范数的相对收敛容限lbfgs
,指定为逗号分隔对,由“梯度公差”
和一个正的实数标量值。
例子:“梯度公差”,0.00001
数据类型:双重的
|单
“InitialLearningRate”
- - - - - -解算器的初始学习率sgd
mdl。InitialLearningRate
(默认)|正实标量值解算器的初始学习率sgd
,指定为逗号分隔对,由“InitialLearningRate”
和一个正的标量值。
使用解算器类型时“sgd”
,学习速率在从指定的值开始的迭代中衰减“InitialLearningRate”
.
例子:“InitialLearningRate”,0.8
数据类型:双重的
|单
“PassLimit”
- - - - - -解算器的最大通过次数“sgd”
mdl.PassLimit
(默认)|正整数值解算器的最大通过次数“sgd”
(随机梯度下降),指定为逗号分隔对,由“PassLimit”
一个正整数。每一个传递过程尺寸(mdl.X, 1)
观察。
例子:“通行限制”,10
数据类型:双重的
|单
“IterationLimit”
- - - - - -最大迭代次数mdl。IterationLimit
(默认)|正整数值最大迭代次数,由逗号分隔对组成“IterationLimit”
一个正整数。
例子:“IterationLimit”,250年
数据类型:双重的
|单
mdlrefit
-邻域成分分析模型的回归特征选择回归
对象邻域成分分析模型或分类,返回为特征选择回归
对象。您可以将结果另存为新模型,也可以将现有模型更新为新模型mdl=重新安装(mdl、名称、值)
.
加载示例数据。
负载(“机器人手臂,脚垫”)
的robotarm
(pumadyn32nm)数据集是使用机器人手臂模拟器创建的,该模拟器具有7168个训练和1024个测试观测值,具有32个特征[1],[2]。这是原始数据集的预处理版本。数据预处理通过减去线性回归拟合,然后所有特征归一化到单位方差。
在不选择特征的情况下计算泛化误差。
nca=fsrnca(Xtrain,ytrain,“FitMethod”,“没有”,“标准化”,1); L=损失(nca、Xtest、ytest)
L=0.9017
现在,重新安装模型,通过特征选择计算预测损失,使用
=0(无正则化项),并与以前的损失值进行比较,以确定此问题似乎需要进行特征选择。对于不更改的设置,改装
使用初始模型的设置nca
。例如,它使用在中找到的特征权重nca
作为初始特征权重。
nca2=重新安装(nca,“FitMethod”,“准确”,“λ”, 0);L2 =损失(nca2 Xtest、欧美)
L2=0.1088
损失的减少表明特征选择是必要的。
绘制特征权重。
图()图(nca2。FeatureWeights,“罗”)
调整正则化参数通常会改善结果
使用交叉验证调整正则化参数的NCA回归,最好的
发现的值是0.0035。改装的nca
使用此
值和随机梯度下降作为求解器。计算预测损失。
nca3 =改装(nca2,“FitMethod”,“准确”,“λ”, 0.0035,...“解算器”,“sgd”);L3 =损失(nca3 Xtest、欧美)
L3=0.0573
绘制特征权重。
图()图(nca3。FeatureWeights,“罗”)
在调整正则化参数后,损失下降得更多,软件识别出四个相关的特征。
工具书类
[1] 拉斯穆森,C.E.,R.M.Neal,G.E.Hinton,D.van Campand,M.Revow,Z.Ghahramani,R.Kustra,R.Tibshirani。DELVE手册,1996年,http://mlg.eng.cam.ac.uk/pub/pdf/RasNeaHinetal96.pdf
你点击一个链接对应于这个MATLAB命令:
通过在MATLAB命令窗口中输入命令来运行命令。Web浏览器不支持MATLAB命令。金宝app
您还可以从以下列表中选择网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。