主要内容

RegressionPartitionedKernel

旨在内核回归模型

自从R2018b

描述

RegressionPartitionedKernel是一组内核回归模型训练旨在折叠。获得一个旨在、内核回归模型使用fitrkernel并指定一个交叉验证选项。你可以估计模型的预测质量,或如何推广的线性回归模型,利用一个或多个“kfold”方法:kfoldPredictkfoldLoss

每个“kfold”训练方法使用模型training-fold观察预测的反应validation-fold观察。例如,假设您旨在使用5折。在这种情况下,软件随机分配每个观测分成五组同等大小的(大概)。的培训褶皱包含四个组的(也就是说,约4/5的数据)和验证褶皱包含另一组(即约1/5的数据)。在这种情况下,交叉验证收益如下:

  1. 软件培训(存储在第一个模型CVMdl.Trained {1})使用观察过去四组和储备第一组的观测验证。

  2. 软件培训(存储在第二个模型CVMdl.Trained {2})使用观察第一组最后三组。软件保留在第二组观察验证。

  3. 软件将以类似的方式通过第五第三模型。

如果验证通过调用kfoldPredict的观测,计算预测使用第一个模型组1,组2第二模式,等等。简而言之,每个观测使用的软件估计响应模型训练没有观察。

请注意

RegressionPartitionedKernel模型对象不存储预测数据集。

创建

创建一个RegressionPartitionedKernel对象使用fitrkernel函数。使用一个“CrossVal”,“CVPartition”,“坚持”,“KFold”,或“Leaveout”名称-值对参数调用fitrkernel。详情,请参阅fitrkernel函数引用页面。

属性

全部展开

交叉验证的属性

这个属性是只读的。

旨在模型名称,指定为一个特征向量。

例如,“内核”指定了一个旨在内核模式。

数据类型:字符

这个属性是只读的。

旨在折叠,指定为一个正整数标量。

数据类型:

这个属性是只读的。

交叉验证参数值,指定为一个对象。参数值的对应名称-值对参数值用于旨在内核回归模型。ModelParameters不包含估计参数。

这个属性是只读的。

在训练数据的观察,指定为一个积极的数字标量。

数据类型:

这个属性是只读的。

数据分区显示软件将数据分为交叉验证折叠,如何指定为一个cvpartition模型。

这个属性是只读的。

内核回归模型训练在交叉验证折叠,指定的单元阵列RegressionKernel模型。训练有素的k细胞,k是折叠的数量。

数据类型:细胞

这个属性是只读的。

观察权重模型,旨在使用指定为一个数值向量。WNumObservations元素。

软件可实现重量以便用于培训sum (W, omitnan)1

数据类型:|

这个属性是只读的。

观察到的响应值模型,旨在使用指定为一个数值向量。YNumObservations元素。

每一行的Y代表观察到的响应预测相应的观测的数据。

数据类型:|

其他回归属性

这个属性是只读的。

分类预测指标,指定为一个向量的正整数。CategoricalPredictors包含索引值表明相应的预测分类。索引值介于1和p,在那里p预测的数量被用来训练模型。如果所有的预测都直言,那么这个属性是空的([])。

数据类型:|

这个属性是只读的。

预测出他们名字的顺序出现在预测数据,指定为一个单元阵列的特征向量。的长度PredictorNames等于列数作为训练数据中预测变量X资源描述

数据类型:细胞

这个属性是只读的。

响应变量名称,指定为一个特征向量。

数据类型:字符

响应变换函数,指定为“没有”或一个函数处理。ResponseTransform描述了软件转换原始响应值的预测模型。

对于一个MATLAB®函数,或者您定义一个函数,输入函数处理。例如,您可以输入Mdl。ResponseTransform = @函数,在那里函数接受一个数字矢量的原始响应并返回一个同样大小的数值向量包含转换后的反应。

数据类型:字符|字符串|function_handle

对象的功能

kfoldLoss 回归损失旨在内核回归模型
kfoldPredict 预测反应的观察旨在内核回归模型

例子

全部折叠

模拟样本数据。

rng (0,“旋风”);%的再现性n = 1000;x = linspace (-10 10 n) ';y = 1 + x * 2依照+ sin (x)。/ x + 0.2 * randn (n, 1);

旨在一个内核回归模型。

CVMdl = fitrkernel (x, y,“Kfold”5);

CVMdl是一个RegressionPartitionedKernel5倍旨在模型。CVMdl.Trained包含了五个单元向量RegressionKernel模型。显示训练有素的财产。

CVMdl.Trained
ans =5×1单元阵列x1 RegressionKernel x1 RegressionKernel {1} {1} {1 x1 RegressionKernel} {1 x1 RegressionKernel} {1 x1 RegressionKernel}

每个单元格都包含一个内核回归模型训练四个折叠,然后剩下的褶皱上对它进行测试。

预测反应的观测验证折叠和估计泛化误差通过CVMdlkfoldPredictkfoldLoss,分别。

yHat = kfoldPredict (CVMdl);L = kfoldLoss (CVMdl)
L = 0.1887

kfoldLoss计算的平均均方误差默认所有的折叠。估计的均方误差是0.1887。

版本历史

介绍了R2018b