主要内容

PeazereSentionncaregresssortion类

使用邻域分量分析的回归特征选择(NCA)

描述

PeazereSentionncarebortion包含邻域分量分析(NCA)模型的数据,拟合信息,特征权重和其他模型参数。FSRNCA使用NCA的对角线调整来了解要素权重,并返回一个实例PeazereSentionncarebortion目的。该功能通过规范特征权重来实现特征选择。

建造

创建一个PeazereSelectionNcaclassification.物体使用FSRNCA

特性

展开全部

培训数据中的观测数量(Xy)除去后或者INF.值,存储为标量。

数据类型:双倍的

用于训练模型的模型参数,存储为结构。

您可以访问字段模特分析者使用点表示法。

例如,对于命名的特点,对于neationedncaregressorlion对象MDL.,你可以访问损失价值使用mdl.modelparameters.lossfunction.

数据类型:塑造

用于训练此模型的正则化参数,存储为标量。为了N.观察,最好的lambda.最小化NCA模型的泛化误差的值预计将是1 /N.

数据类型:双倍的

用于适合此模型的拟合方法的名称,存储为以下之一:

  • '精确的'- 使用所有数据执行拟合。

  • '没有任何'- 没有配件。使用此选项使用呼叫中提供的初始功能权重评估NCA模型的泛化误差FSRNCA

  • '平均数'- 软件将数据划分为分区(子集),使用每个分区使用精确的方法,并返回特征权重的平均值。您可以使用该分区指定分区数numpartitions.名称值对参数。

用于适合此模型的求解器的名称,存储为以下之一:

  • 'lbfgs'- 有限的记忆泡沫 - 弗莱彻 - 戈尔科 - 桑诺(LBFGS)算法

  • 'SGD'- 随机梯度下降(SGD)算法

  • 'minibatch-lbfgs'- 随机梯度下降与LBFGS算法应用于迷你批次

对梯度规范的相对收敛耐受性'lbfgs''minibatch-lbfgs'求解器,存储为正标量值。

数据类型:双倍的

优化的最大迭代次数,存储为正整数值。

数据类型:双倍的

最大通行证数'SGD''minibatch-lbfgs'求解器。每个传递处理数据中的所有观察。

数据类型:双倍的

初始学习率'SGD''minibatch-lbfgs'求解器。学习速率衰减以指定的值开始的迭代initialLearningrate.

使用numtuning韵调整aubsetsize.控制呼叫中的初始学习率的自动调整FSRNCA

数据类型:双倍的

详细级别指示符,存储为非负整数。可能的值是:

  • 0 - 没有收敛摘要

  • 1 - 收敛摘要,包括梯度和目标函数值的规范

  • > 1 - 根据拟合算法,更多收敛信息。当你使用的时候'minibatch-lbfgs'求解器和冗长级别> 1,收敛信息包括来自中间小贴士LBFGS的迭代日志。

数据类型:双倍的

初始特征权重,存储为aP.-by-1阳性真正的标量向量,在哪里P.是预测因子的数量X

数据类型:双倍的

要素权重,存储为aP.-1个真正标量值的向量,在哪里P.是预测因子的数量X

为了'fitmethod'等于'平均数'功能重量是A.P.-经过-m矩阵,其中m是通过该分区指定的分区数量'numpartitions'呼叫中的名称值对参数FSRNCA

绝对值功能重量(k)是预测因素的重要性的衡量标准K.。如果功能重量(k)接近0,这表明预测器K.不会影响反应y

数据类型:双倍的

适合信息,存储为具有以下字段的结构。

字段名称 意义
迭代 迭代索引
客观的 用于最小化的正常目标函数
缺陷的机制 未降低的目标函数以最小化
坡度 用于最小化的正规目标函数的梯度
  • 分类,缺陷的机制表示NCA分类器对训练数据的休假准确性的负面。

  • 回归,缺陷的机制表示使用NCA回归模型时的真实响应与预测响应之间的休假丢失。

  • 为了'lbfgs'求解器,坡度是最终的渐变。为了'SGD''minibatch-lbfgs'求解器,坡度是最终的迷你批量渐变。

  • 如果Fitmethod.'平均数', 然后FitInfo.是一个m-By-1结构阵列,在哪里m是通过该分区指定的分区数量'numpartitions'名称值对参数。

您可以访问字段FitInfo.使用点表示法。例如,对于neationselectionncaregressionionObject命名MDL.,你可以访问客观的现场使用mdl.fitinfo.objective.

数据类型:塑造

预测器意味着,存储为P.- 1个标准化训练数据的向量。在这种情况下,预测方法中心预测矩阵X通过减去各个元素从每一列。

如果在训练期间没有标准化数据,那么是空的。

数据类型:双倍的

预测标准偏差,存储为P.- 1个标准化训练数据的向量。在这种情况下,预测方法尺度预测矩阵X通过各自的元素划分每个列Sigma.使用数据以居中居中

如果在训练期间没有标准化数据,那么Sigma.是空的。

数据类型:双倍的

用于培训此模型的预测值值,存储为N.-经过-P.矩阵。N.是观察人数和P.是培训数据中的预测器变量的数量。

数据类型:双倍的

用于训练此模型的响应值,存储为大小的数字矢量N.,其中n是观察的数量。

数据类型:双倍的

用于训练此模型的观察权重,存储为大小的数字矢量N.。观察权重的总和是N.

数据类型:双倍的

方法

失利 评估测试数据学习功能权重的准确性
预测 使用邻域分量分析(NCA)回归模型的响应
改装 回归邻域分量分析(NCA)模型

例子

全部收缩

加载样本数据。

加载进口-85.

前15列包含连续的预测变量,而第16列包含响应变量,这是汽车的价格。定义邻域分量分析模型的变量。

预测器= x(:,1:15);y = x(:,16);

适合回归的邻域分量分析(NCA)模型以检测相关特征。

mdl = fsrnca(预测器,y);

返回的NCA模型,MDL.,是A.PeazereSentionncarebortion目的。该对象存储有关培训数据,模型和优化的信息。您可以使用点表示法访问对象属性,例如要素权重。

绘制特征权重。

图()绘图(mdl.featureweights,'ro')Xlabel('特征索引')ylabel('特征重量') 网格

图包含轴。轴包含类型线的对象。

无关的特征的重量为零。这'verbose',1呼叫中的选项FSRNCA在命令行上显示优化信息。您还可以通过绘制目标函数与迭代号来可视化优化过程。

图()绘图(mdl.fitinfo.jertation,mdl.fitinfo.objective,'ro-') 网格Xlabel('迭代号')ylabel('客观的'

图包含轴。轴包含类型线的对象。

模特分析者物业是A.塑造其中包含有关模型的更多信息。您可以使用点表示法访问此属性的字段。例如,请参阅数据是否标准化。

mdl.modelparameters.standardize.
ans =.逻辑0.

0.意味着在拟合NCA模型之前未标准化数据。当使用时,您可以在非常不同的尺度上标准化预测器'标准化',1呼叫中的名称值对参数FSRNCA

复制语义

价值。要了解值类如何影响复制操作,请参阅复制对象

也可以看看

|||

介绍在R2016B.