主要内容

改装

类别:特征选择回归

修正邻域成分分析(NCA)回归模型

语法

mdlrefit =改装(mdl、名称、值)

描述

mdlrefit=重新安装(mdl名称、值不菲的模型mdl,具有一个或多个指定的修改参数名称、值配对参数。

输入参数

全部展开

邻域成分分析模型或分类,指定为特征选择回归对象

名称-值对参数

指定可选的逗号分隔的对名称、值论据。的名字参数名和价值是对应的值。的名字必须出现在引号内。您可以按任意顺序指定多个名称和值对参数,如下所示:名称1,值1,…,名称,值

合适的选项

全部展开

模型拟合方法,指定为逗号分隔对组成“FitMethod”下面是其中之一。

  • “准确”-使用所有数据执行拟合。

  • “没有”-无拟合。使用此选项可使用调用中提供的初始特征权重来评估NCA模型的泛化误差fsrnca

  • “平均”-该函数将数据划分为多个分区(子集),并使用准确的方法,并返回特征权重的平均值。您可以使用NumPartitions名称-值对的论点。

例子:“FitMethod”和“none”

正则化参数,指定为逗号分隔对,由“λ”和一个非负标量值。

n观察,最好的λ将NCA模型的概化误差最小化的值预期为1/的倍数n

例子:“λ”,0.01

数据类型:双重的|

用于估计特征权重的求解器类型,指定为由逗号分隔的对组成“解算器”下面是其中之一。

  • “lbfgs”-有限内存BFGS(Broyden-Fletcher-Goldfarb-Shanno)算法(LBFGS算法)

  • “sgd”-随机梯度下降

  • “小批量lbfgs”-随机梯度下降与LBFGS算法应用于小批量

例子:‘解算器’,‘minibatch-lbfgs’

初始特征权重,指定为逗号分隔对,由“初始特征权重”p-实正标量值的x-1向量。

数据类型:双重的|

收敛摘要显示的详细程度指示符,指定为由逗号分隔的对组成“冗长”下面是其中之一。

  • 0-无收敛性摘要

  • 1 -收敛总结,包括迭代次数、梯度范数、目标函数值。

  • >1-更多收敛信息取决于拟合算法

    使用解算器时“小批量lbfgs”和详细级>1,收敛信息包括中间小批LBFGS拟合的迭代日志。

例子:“详细”,2

数据类型:双重的|

LBFGS或Mini-Batch LBFGS选项

全部展开

求解器梯度范数的相对收敛容限lbfgs,指定为逗号分隔对,由“梯度公差”和一个正的实数标量值。

例子:“梯度公差”,0.00001

数据类型:双重的|

SGD或迷你批量LBFGS选项

全部展开

解算器的初始学习率sgd,指定为逗号分隔对,由“InitialLearningRate”和一个正的标量值。

使用解算器类型时“sgd”,学习速率在从指定的值开始的迭代中衰减“InitialLearningRate”

例子:“InitialLearningRate”,0.8

数据类型:双重的|

解算器的最大通过次数“sgd”(随机梯度下降),指定为逗号分隔对,由“PassLimit”一个正整数。每一个传递过程尺寸(mdl.X, 1)观察。

例子:“通行限制”,10

数据类型:双重的|

SGD或LBFGS或Mini-Batch LBFGS选项

全部展开

最大迭代次数,由逗号分隔对组成“IterationLimit”一个正整数。

例子:“IterationLimit”,250年

数据类型:双重的|

输出参数

全部展开

邻域成分分析模型或分类,返回为特征选择回归对象。您可以将结果另存为新模型,也可以将现有模型更新为新模型mdl=重新安装(mdl、名称、值)

例子

全部展开

加载示例数据。

负载(“机器人手臂,脚垫”

robotarm(pumadyn32nm)数据集是使用机器人手臂模拟器创建的,该模拟器具有7168个训练和1024个测试观测值,具有32个特征[1],[2]。这是原始数据集的预处理版本。数据预处理通过减去线性回归拟合,然后所有特征归一化到单位方差。

在不选择特征的情况下计算泛化误差。

nca=fsrnca(Xtrain,ytrain,“FitMethod”“没有”“标准化”,1); L=损失(nca、Xtest、ytest)
L=0.9017

现在,重新安装模型,通过特征选择计算预测损失,使用 λ =0(无正则化项),并与以前的损失值进行比较,以确定此问题似乎需要进行特征选择。对于不更改的设置,改装使用初始模型的设置nca。例如,它使用在中找到的特征权重nca作为初始特征权重。

nca2=重新安装(nca,“FitMethod”“准确”“λ”, 0);L2 =损失(nca2 Xtest、欧美)
L2=0.1088

损失的减少表明特征选择是必要的。

绘制特征权重。

图()图(nca2。FeatureWeights,“罗”

图中包含一个轴。轴包含类型为line的对象。

调整正则化参数通常会改善结果 λ 使用交叉验证调整正则化参数的NCA回归,最好的 λ 发现的值是0.0035。改装的nca使用此 λ 值和随机梯度下降作为求解器。计算预测损失。

nca3 =改装(nca2,“FitMethod”“准确”“λ”, 0.0035,...“解算器”“sgd”);L3 =损失(nca3 Xtest、欧美)
L3=0.0573

绘制特征权重。

图()图(nca3。FeatureWeights,“罗”

图中包含一个轴。轴包含类型为line的对象。

在调整正则化参数后,损失下降得更多,软件识别出四个相关的特征。

工具书类

[1] 拉斯穆森,C.E.,R.M.Neal,G.E.Hinton,D.van Campand,M.Revow,Z.Ghahramani,R.Kustra,R.Tibshirani。DELVE手册,1996年,http://mlg.eng.cam.ac.uk/pub/pdf/RasNeaHinetal96.pdf

[2]https://www.cs.toronto.edu/~delve/data/datasets.html

介绍了R2016b