主要内容

FeatureSelectionNCAClassification类

基于邻域成分分析(NCA)的分类特征选择

描述

FeatureSelectionNCAClassification对象包含邻域分量分析(NCA)模型的数据,拟合信息,特征权重和其他参数。fscnca使用对角自适应的NCA学习特征权值,并返回一个实例FeatureSelectionNCAClassification对象。该函数通过正则化特征权值来实现特征选择。

建设

创建一个FeatureSelectionNCAClassification对象使用fscnca

属性

展开全部

培训数据中的观测数量(XY后删除INF.值,以标量形式存储。

数据类型:双倍的

用于训练模型的模型参数,存储为结构。

您可以访问字段ModelParameters使用点表示法。

例如,对于一个名为MDL.,你可以访问LossFunction价值使用mdl.modelparameters.lossfunction.

数据类型:塑造

正则化参数用于训练该模型,存储为标量。为n观察,最好的λ值,使NCA模型的泛化误差最小,预期为1/的倍数n

数据类型:双倍的

用于拟合此模型的拟合方法的名称,存储为以下其中之一:

  • “准确”- 使用所有数据执行拟合。

  • “没有”- 没有配件。使用此选项使用呼叫中提供的初始功能权重评估NCA模型的泛化误差fscnca

  • '平均数'—将数据划分为多个分区(子集),每个分区使用精确的方法,并返回特征权值的平均值。属性指定分区的数量NumPartitions名称-值对的论点。

用于拟合此模型的求解器的名称,存储为下列之一:

  • 'lbfgs'- 有限的记忆泡沫 - 弗莱彻 - 戈尔科 - 桑诺(LBFGS)算法

  • “sgd”-随机梯度下降(SGD)算法

  • 'minibatch-lbfgs'- 随机梯度下降与LBFGS算法应用于迷你批次

相对收敛公差上的梯度范数'lbfgs''minibatch-lbfgs'求解器,存储为正标量值。

数据类型:双倍的

优化的最大迭代次数,存储为正整数值。

数据类型:双倍的

最大传递次数“sgd”'minibatch-lbfgs'求解器。每个传递处理数据中的所有观察。

数据类型:双倍的

初始学习率“sgd”'minibatch-lbfgs'求解器,存储为一个正实标量。学习速率从指定的值开始在迭代中衰减initialLearningrate.

使用NumTuningIterationsTuningSubsetSize名称-值对参数用于控制初始学习速率的自动调优fscnca

数据类型:双倍的

冗余级别指示器,以非负整数形式存储。可能的值是:

  • 0 - 没有收敛摘要

  • 1 - 收敛摘要,包括梯度和目标函数值的规范

  • 1 -更多的收敛信息,取决于拟合算法。当你使用'minibatch-lbfgs'收敛信息包括中间小批量LBFGS拟合的迭代日志。

数据类型:双倍的

初始特征权值,存储为p负1向量的正实标量,其中p预测因子的数量在吗X

数据类型:双倍的

特征权重,存储为p-1-1的真正标量向量,在哪里p预测因子的数量在吗X

如果Fitmethod.'平均数',然后FeatureWeights是一个p-经过-矩阵。指定的分区数量是'numpartitions'的调用中的名称-值对参数fscnca

的绝对值功能重量(k)衡量预测器的重要性k。一个功能重量(k)接近0的值表示预测器k不影响反应中Y

数据类型:双倍的

适合信息,存储为具有以下字段的结构。

字段名称 意义
迭代 迭代索引
客观的 用于最小化的正常目标函数
UnregularizedObjective 非正则化目标函数的最小化
梯度 用于最小化的正规目标函数的梯度
  • 分类,UnregularizedObjective表示NCA分类器对训练数据的留一精度的负值。

  • 回归,UnregularizedObjective表示使用NCA回归模型时真实响应与预测响应之间的遗漏损失。

  • 'lbfgs'解算器,梯度是最终的渐变。为“sgd”'minibatch-lbfgs'求解器,梯度是最终的迷你批量渐变。

  • 如果Fitmethod.'平均数',然后FitInfo是一个-By-1结构阵列,在哪里指定的分区数量是'numpartitions'名称-值对的论点。

您可以访问字段FitInfo使用点表示法。例如,对于neationeLectionncaclassificationObject命名MDL.,你可以访问客观的现场使用mdl.fitinfo.objective.

数据类型:塑造

预测器意味着,存储为p- 1个标准化训练数据的向量。在这种情况下,预测方法中心预测矩阵X减去对应的元素从每一列。

如果在培训期间数据没有标准化,那么是空的。

数据类型:双倍的

预测标准偏差,存储为p- 1个标准化训练数据的向量。在这种情况下,预测方法尺度预测矩阵X将每一列分别除以σ使用数据以居中居中

如果在培训期间数据没有标准化,那么σ是空的。

数据类型:双倍的

用于训练此模型的预测器值,存储为n-经过-p矩阵。n是观察人数和p为训练数据中预测变量的个数。

数据类型:双倍的

用于训练此模型的响应值,存储为数值向量的大小n,其中n为观测到的次数。

数据类型:双倍的

用于训练此模型的观察权重,存储为大小的数字矢量n。观察权重的总和是n

数据类型:双倍的

方法

失利 评估学习到的特征权重对测试数据的准确性
预测 使用邻域分量分析(NCA)分类器预测响应
改装 改装邻里分量分析(NCA)分类模型

例子

全部收缩

加载样本数据。

负载电离层

数据集具有34个连续预测器。响应变量是雷达返回,标记为B(坏)或g(好)。

适合邻域分量分析(NCA)模型,用于分类以检测相关功能。

mdl = fscnca (X, Y);

返回的NCA模型,MDL.,是A.FeatureSelectionNCAClassification对象。该对象存储有关训练数据、模型和优化的信息。您可以使用点表示法访问对象属性,如特性权重。

绘制特征权重。

图()图(mdl。FeatureWeights,“罗”)包含(“功能指数”)ylabel('特征重量') 网格

图包含轴。轴包含类型线的对象。

无关的特征的重量为零。的“详细”,1选项fscnca在命令行上显示优化信息。您还可以通过绘制目标函数和迭代数来可视化优化过程。

图绘制(mdl.FitInfo.Iteration mdl.FitInfo.Objective,'ro-') 网格Xlabel(的迭代次数)ylabel(“目标”)

图包含轴。轴包含类型线的对象。

ModelParameters物业是A.塑造其中包含有关模型的更多信息。您可以使用点表示法访问此属性的字段。例如,请参阅数据是否标准化。

mdl.modelparameters.standardize.
ans =.逻辑0

0意味着在拟合NCA模型之前未标准化数据。当使用时,您可以在非常不同的尺度上标准化预测器'标准化',1的调用中的名称-值对参数fscnca

复制语义

价值。要了解值类如何影响复制操作,请参阅复制对象

介绍了R2016b