主要内容

FeatureSelectionNCARegression类

特征选择回归使用社区成分分析(NCA)

描述

FeatureSelectionNCARegression包含数据,拟合信息、特征权重和其他模型参数的一个社区成分分析(NCA)模型。fsrnca学习使用对角特征权重改编的NCA并返回的一个实例FeatureSelectionNCARegression对象。正则化函数实现特征选择的特征权重。

建设

创建一个FeatureSelectionNCAClassification对象使用fsrnca

属性

全部展开

训练数据的观测数量(XY后删除值,存储为一个标量。

数据类型:

模型参数用于训练模型、存储结构。

您可以访问的字段ModelParameters使用点符号。

例如,对于一个FeatureSelectionNCARegression对象命名mdl,你可以访问LossFunction使用价值mdl.ModelParameters.LossFunction

数据类型:结构体

正则化参数用于训练该模型中,存储为一个标量。为n观察,最好的λ值最小化NCA模型的泛化误差预计是1 /的倍数n

数据类型:

拟合方法的名称符合这一模型中,存储为以下之一:

  • “准确”——使用的所有数据进行拟合。

  • “没有”——不合适。使用这个选项来评估NCA模型的泛化误差使用最初的功能权重提供调用fsrnca

  • “平均”——软件将数据划分为分区(子集),符合每个分区使用确切的方法,并返回特征权重的平均值。您可以指定分区使用的数量NumPartitions名称-值对的论点。

解算器的名称用于符合这一模型中,存储为以下之一:

  • “lbfgs”-内存有限Broyden-Fletcher-Goldfarb-Shanno (LBFGS)算法

  • “sgd”随机梯度下降法(SGD)算法

  • “minibatch-lbfgs”-与LBFGS随机梯度下降算法应用于mini-batches

相对收敛宽容的梯度准则“lbfgs”“minibatch-lbfgs”解决,存储为一个积极的标量值。

数据类型:

最大数量的迭代优化,存储为一个正整数的值。

数据类型:

最大数量的通行证“sgd”“minibatch-lbfgs”解决者。每个传递过程中的所有观测数据。

数据类型:

初始学习速率“sgd”“minibatch-lbfgs”解决者。学习速率随迭代从指定的值InitialLearningRate

使用NumTuningIterationsTuningSubsetSize控制自动调优初始学习速率的调用fsrnca

数据类型:

冗长的水平指示器,存储为一个非负整数。可能的值是:

  • 0 -不收敛的总结

  • 1 -收敛性总结,包括梯度准则和目标函数值

  • > 1 -更收敛性的信息,根据拟合的算法。当你使用“minibatch-lbfgs”解算器和冗长水平> 1,收敛的迭代日志信息包括中间mini-batch LBFGS适合。

数据类型:

初始特征权重,存储为一个p1积极的真正的标量,矢量p预测的数量吗X

数据类型:

特征权重,存储为一个p1真正的标量值向量,p预测的数量吗X

“FitMethod”等于“平均”,FeatureWeights是一个p——- - - - - -矩阵,通过指定分区的数量吗“NumPartitions”调用的名称-值对的论点fsrnca

的绝对值FeatureWeights (k)是一个衡量预测的重要性k。如果FeatureWeights (k)接近0,那么这表明预测k不影响反应Y

数据类型:

健康信息,存储为与以下领域的结构。

字段名 意义
迭代 迭代索引
客观的 正规化为最小化目标函数
UnregularizedObjective Unregularized为最小化目标函数
梯度 梯度正则化目标函数的最小化
  • 的分类,UnregularizedObjective代表的负面分析NCA分类器在训练数据的准确性。

  • 对于回归,UnregularizedObjective代表分析损失之间的真实反应,当使用NCA回归模型预测反应。

  • “lbfgs”解算器,梯度是最后的梯度。为“sgd”“minibatch-lbfgs”解决,梯度是最终mini-batch梯度。

  • 如果FitMethod“平均”,然后FitInfo是一个1结构数组,在那里通过指定分区的数量吗“NumPartitions”名称-值对的论点。

您可以访问的字段FitInfo使用点符号。例如,对于一个FeatureSelectionNCARegressionobject命名mdl,你可以访问客观的现场使用mdl.FitInfo.Objective

数据类型:结构体

预测方法,存储为一个p1向量进行标准化的训练数据。在这种情况下,预测方法中心预测矩阵X减去相应的元素μ从每一列。

如果数据不是标准化的培训期间,μ是空的。

数据类型:

预测标准差,存储为一个p1向量进行标准化的训练数据。在这种情况下,预测方法尺度预测矩阵X每一列除以各自的元素σ在定心数据后使用μ

如果数据不是标准化的培训期间,σ是空的。

数据类型:

用来训练该模型预测值,存储为一个n——- - - - - -p矩阵。n是观察和的数量吗p是训练数据中预测变量的数量。

数据类型:

响应值用来训练该模型中,存储为数字矢量的大小n,其中n是观测的数量。

数据类型:

观察权重训练该模型使用,存储为数字矢量的大小n。观察权重的总和n

数据类型:

方法

损失 评估学习精度特性测试数据的权重
预测 预测反应使用社区成分分析(NCA)回归模型
改装 改装社区成分分析(NCA)回归模型

例子

全部折叠

加载示例数据。

负载进口- 85

第一个15列包含连续预测变量,而16列包含响应变量,这是一辆车的价格。为社区组件定义的变量分析模型。

预测= X (: 1:15);Y = X (: 16);

适合附近成分分析(NCA)回归模型来检测相关的特性。

mdl = fsrnca(预测,Y);

返回NCA模型,mdl,是一个FeatureSelectionNCARegression对象。这个对象存储训练数据的信息,模型,和优化。您可以访问对象属性,如功能权重,使用点符号。

画出功能权重。

图()图(mdl.FeatureWeights,“罗”)包含(“功能指数”)ylabel (“功能重量”网格)

图包含一个坐标轴对象。坐标轴对象包含功能指数,ylabel特性重量包含一行对象显示它的值只使用标记。

无关紧要的特征的权重为零。的“详细”,1在调用选项fsrnca在命令行上显示优化信息。你也可以可视化优化过程策划目标函数和迭代数。

图()图(mdl.FitInfo.Iteration mdl.FitInfo.Objective,“ro - - - - - -”网格)包含(的迭代次数)ylabel (“目标”)

图包含一个坐标轴对象。坐标轴对象包含迭代数,ylabel目标包含一个类型的对象。

ModelParameters属性是一个结构体模型包含更多的信息。您可以访问的字段属性使用点符号。例如,看看数据是否标准化。

mdl.ModelParameters.Standardize
ans =逻辑0

0意味着之前的数据没有标准化NCA模型拟合。你可以规范预测时在不同尺度的使用“标准化”,1调用的名称-值对的论点fsrnca

复制语义

价值。学习如何价值类影响复制操作,明白了复制对象

版本历史

介绍了R2016b