FeatureSelectionNCA回归类

基于邻域成分分析(NCA)的回归特征选择

全部展开页面

描述

FeatureSelectionNCARegression包含邻域分量分析(NCA)模型的数据、拟合信息、特征权重和其他模型参数。fsrnca使用NCA的对角自适应学习特征权重，并返回FeatureSelectionNCARegression对象。该函数通过正则化特征权重来实现特征选择。

建设

创建一个FeatureSelectionNCAClassification对象使用fsrnca．

属性

全部展开

`NumObservations`—培训数据中的观察次数
标量

训练数据中的观测次数(X和Y)移除后楠或Inf值，存储为标量。

数据类型:双

`模型参数`—模型参数
结构

用于训练模型的模型参数，存储为结构。

您可以访问模型参数使用点符号。

例如，对于名为mdl，您可以访问LossFunction价值使用mdl.ModelParameters.LossFunction．

数据类型:结构

`兰姆达`—正则化参数
标量

用于训练此模型的正则化参数，存储为标量。对于N观察，最好的兰姆达将NCA模型的概化误差最小化的值预期为1/的倍数N．

数据类型:双

`菲特法`—用于拟合此模型的拟合方法的名称
`“准确”`|`“没有”`|`“平均”`

用于拟合该模型的拟合方法名称，存储为:

“准确”-使用所有数据进行拟合。
“没有”——不合适。使用此选项，可以使用调用中提供的初始特征权重来评估NCA模型的泛化误差fsrnca．
“平均”—软件将数据划分为多个分区(子集)，使用确切的方法，并返回特征权重的平均值。您可以使用数量名称-值对参数。

`解算器`—用于拟合此模型的求解器的名称
`“lbfgs”`|`“新加坡元”`|`“minibatch-lbfgs”`

用于拟合此模型的解算器的名称，存储为以下内容之一：

“lbfgs”-有限内存Broyden-Fletcher-Goldfarb-Shanno（LBFGS）算法
“新加坡元”-随机梯度下降（SGD）算法
“minibatch-lbfgs”-基于LBFGS算法的随机梯度下降法在小批量生产中的应用

`梯度公差`—梯度范数的相对收敛容限
正标量

梯度范数的相对收敛容限“lbfgs”和“minibatch-lbfgs”解算器，存储为正标量值。

数据类型:双

`IterationLimit`—优化的最大迭代次数
正整数

优化的最大迭代次数，存储为正整数值。

数据类型:双

`通行限制`—最大通过次数
正整数

最大通过次数为“新加坡元”和“minibatch-lbfgs”解算器。每次传递都会处理数据中的所有观察结果。

数据类型:双

`初始学习率`—最初的学习速率
积极的真正的标量

学生的初始学习率“新加坡元”和“minibatch-lbfgs”解算器。从指定的值开始，学习速率在迭代过程中衰减初始学习率．

使用NumTuningIterations和调整子集控制调用中初始学习速率的自动调谐fsrnca．

数据类型:双

`冗长的`—详细程度指示器
非负整数

详细程度级别指示符，存储为非负整数。可能的值是:

0-无收敛性摘要
1 -收敛总结，包括梯度范数和目标函数值
>1 -更多的收敛信息，取决于拟合算法。当你使用“minibatch-lbfgs”解算器和详细级别>1时，收敛信息包括中间小批量LBFGS拟合的迭代日志。

数据类型:双

`初始特征权重`—初始特征权重
P-正实标量的by-1向量

初始特征权重，存储为P-正实标量的by-1向量，其中P预测器的数量在吗X．

数据类型:双

`特征重量`—特征权值
P-实标量值的by-1向量

特征权重，存储为P实标量值的-乘1向量，其中P预测器的数量在吗X．

对于“FitMethod”等于“平均”,特征重量是一个P——- - - - - -M矩阵，在哪里M分区的数量是否通过“NumPartitions”的调用中的名称-值对参数fsrnca．

绝对值特征权重（k）是对预测者重要性的衡量吗K．如果特征权重（k）接近于0，那么这表示预测因子K不会影响中的响应Y．

数据类型:双

`FitInfo`—拟合信息
结构

Fit信息，存储为具有以下字段的结构。

字段名	意义
`迭代`	迭代索引
`客观的`	正则化的最小化目标函数
`UnregularizedObjective`	非正则化最小化目标函数
`梯度`	最小化正则化目标函数的梯度

对于分类，UnregularizedObjective表示NCA分类器对训练数据的漏一准确率的负数。
对于回归，UnregularizedObjective表示使用NCA回归模型时真实响应与预测响应之间的漏一损失。
为“lbfgs”解决方案，梯度是最后的梯度。为“新加坡元”和“minibatch-lbfgs”解决方案，梯度为最终的小批量梯度。
如果菲特法是“平均”然后FitInfo是一个M-by-1结构数组M分区的数量是否通过“NumPartitions”名称-值对参数。

您可以访问FitInfo使用点表示法。例如，对于名为mdl，您可以访问客观的现场使用mdl.FitInfo.Objective．

数据类型:结构

`μ`—预测方法
P-by-1向量|`［］`

预测器的意思，存储为P-标准化训练数据的by-1向量。在这种情况下预测预测矩阵法X通过减去μ从每一列。

如果在培训期间数据没有标准化，那么μ是空的。

数据类型:双

`σ`—预测标准差
P-by-1向量|`［］`

预测标准偏差，存储为P-标准化训练数据的by-1向量。在这种情况下预测方法尺度预测矩阵X通过将每列除以σ对中后数据使用μ．

如果在培训期间数据没有标准化，那么σ是空的。

数据类型:双

`X`—预测的值
N——- - - - - -P矩阵

用于训练此模型的预测值，存储为N——- - - - - -P矩阵。N观察的次数是多少P是训练数据中预测变量的数量。

数据类型:双

`Y`—响应值
大小数字向量N

用于训练此模型的响应值，存储为大小的数字向量N，其中n为观测次数。

数据类型:双

`W`—观察权重
大小数字向量N

用于训练此模型的观测权重，存储为大小的数值向量N．观测权之和为N．

数据类型:双

方法

损失	根据测试数据评估学习特征权重的准确性
预测	使用邻域成分分析(NCA)回归模型预测响应
改装	修正邻域分量分析(NCA)模型进行回归

例子

全部崩溃

探索`FeatureSelectionNCARegression`对象

打开生活的脚本

加载示例数据。

负载进口-85

前15列包含连续预测变量，而第16列包含响应变量，即汽车价格。定义邻域组件分析模型的变量。

预测= X (: 1:15);Y = X (: 16);

拟合邻域成分分析（NCA）模型进行回归，以检测相关特征。

mdl=fsrnca（预测因子，Y）；

返回的NCA模型，mdl,是一个FeatureSelectionNCARegression对象此对象存储有关训练数据、模型和优化的信息。可以使用点表示法访问对象特性，例如特征权重。

绘制特征权重。

图()图(mdl。FeatureWeights,“罗”)包含(“功能索引”) ylabel (“功能重量”网格)在

图中包含一个轴对象。axes对象包含类型为line的对象。

无关特征的权值为零。这个“详细”,1调用中的选项fsrnca在命令行上显示优化信息。您还可以通过绘制目标函数与迭代次数来可视化优化过程。

figure（）绘图（mdl.FitInfo.Iteration、mdl.FitInfo.Objective、，“ro - - - - - -”网格)在包含(的迭代次数) ylabel (“目标”)

图中包含一个轴对象。axes对象包含类型为line的对象。

这个模型参数财产是一种财富结构其中包含有关模型的更多信息。可以使用点表示法访问此属性的字段。例如，查看数据是否标准化。

mdl.ModelParameters.Standardize

ans=必然的0

0说明在拟合NCA模型前数据未标准化。你可以标准化预测当它们在非常不同的尺度上使用“标准化”,1的调用中的名称-值对参数fsrnca．

复制语义

价值要了解值类如何影响复制操作，请参见复制对象．

另见

预测|fsrnca|改装|损失

话题

R2016b中引入

统计和机器学习工具箱文档

金宝app

掌握机器学习：用MATLAB逐步指导

下载电子书

FeatureSelectionNCA回归类

描述

建设

属性

NumObservations—培训数据中的观察次数标量

模型参数—模型参数结构

兰姆达—正则化参数标量

菲特法—用于拟合此模型的拟合方法的名称“准确”|“没有”|“平均”

解算器—用于拟合此模型的求解器的名称“lbfgs”|“新加坡元”|“minibatch-lbfgs”

梯度公差—梯度范数的相对收敛容限正标量

IterationLimit—优化的最大迭代次数正整数

通行限制—最大通过次数正整数

初始学习率—最初的学习速率积极的真正的标量

冗长的—详细程度指示器非负整数

初始特征权重—初始特征权重P-正实标量的by-1向量

特征重量—特征权值P-实标量值的by-1向量

FitInfo—拟合信息结构

μ—预测方法P-by-1向量|［］

σ—预测标准差P-by-1向量|［］

X—预测的值N——- - - - - -P矩阵

Y—响应值大小数字向量N

W—观察权重大小数字向量N

方法

例子

探索FeatureSelectionNCARegression对象

复制语义

另见

话题

统计和机器学习工具箱文档

金宝app

掌握机器学习：用MATLAB逐步指导

`NumObservations`—培训数据中的观察次数
标量

`模型参数`—模型参数
结构

`兰姆达`—正则化参数
标量

`菲特法`—用于拟合此模型的拟合方法的名称
`“准确”`|`“没有”`|`“平均”`

`解算器`—用于拟合此模型的求解器的名称
`“lbfgs”`|`“新加坡元”`|`“minibatch-lbfgs”`

`梯度公差`—梯度范数的相对收敛容限
正标量

`IterationLimit`—优化的最大迭代次数
正整数

`通行限制`—最大通过次数
正整数

`初始学习率`—最初的学习速率
积极的真正的标量

`冗长的`—详细程度指示器
非负整数

`初始特征权重`—初始特征权重
P-正实标量的by-1向量

`特征重量`—特征权值
P-实标量值的by-1向量

`FitInfo`—拟合信息
结构

`μ`—预测方法
P-by-1向量|`［］`

`σ`—预测标准差
P-by-1向量|`［］`

`X`—预测的值
N——- - - - - -P矩阵

`Y`—响应值
大小数字向量N

`W`—观察权重
大小数字向量N

探索`FeatureSelectionNCARegression`对象