updateMetrics

更新性能指标在线性增量学习模型给定的新数据

语法

Mdl = updateMetrics (Mdl, X, Y)

Mdl = updateMetrics (Mdl, X, Y,名称,值)

描述

给定的流数据,updateMetrics措施的性能配置增量学习模型为线性回归(incrementalRegressionLinear(对象)或线性二元分类incrementalClassificationLinear对象)。updateMetrics存储性能指标的输出模型。

updateMetrics允许灵活的增量学习。后调用该函数来更新模型性能指标对传入的数据,您可以执行其他操作之前火车模型的数据。例如,您可以决定你是否需要培训模型基于业绩分配一个数据块。或者,您可以更新模型性能指标和训练模型数据到达时,在一个调用中,通过使用updateMetricsAndFit函数。

测量模型的性能在一个指定的一批数据,调用损失代替。

例子

Mdl= updateMetrics (Mdl,X,Y)返回一个增量学习模型Mdl,这是输入增量学习模型Mdl修改为包含模型性能指标的预测和响应数据,X和Y分别。

当输入模型温暖的(Mdl.IsWarm是真正的),updateMetrics覆盖之前的计算指标,存储在指标财产,用新的价值观。否则,updateMetrics商店南值指标代替。

输入和输出模型具有相同的数据类型。

例子

Mdl= updateMetrics (Mdl,X,Y,名称,值)使用附加选项指定一个或多个参数名称-值对。例如,您可以指定预测数据矩阵的列对应于观测,并设置观察权重。

例子

全部折叠

增量模型的跟踪性能

打开生活的脚本

火车二进制分类使用的线性模型fitclinear,把它转换成增量学习,然后跟踪流数据的性能。

加载和数据预处理

载入人类活动数据集。随机洗牌数据。

负载humanactivityrng (1)%的再现性n =元素个数(actid);idx = randsample (n, n);X =壮举(idx:);Y = actid (idx);

细节的数据集,输入描述在命令行中。

响应可以是五类:坐着,站着,散步,跑步,或者跳舞。二分响应通过识别主题是否移动(actid> 2)。

Y = Y > 2;

为二进制分类培训线性模型

二进制分类符合线性模型的随机样本数据的一半。

idxtt = randsample((真假),n, true);TTMdl = fitclinear (X (idxtt:), Y (idxtt))

TTMdl = ClassificationLinear ResponseName:“Y”类名:[0 1]ScoreTransform:“没有一个”测试:[60 x1双]偏见:-0.2999λ:8.2967 e-05学习者:“支持向量机”属性,方法

TTMdl是一个ClassificationLinear模型对象代表二进制分类的传统训练的线性模型。

转换训练模型

传统训练分类模型转换为一个二进制分类线性模型的增量学习。

IncrementalMdl = incrementalLearner (TTMdl)

IncrementalMdl = incrementalClassificationLinear IsWarm: 1指标:[1 x2表]一会:[0 1]ScoreTransform:“没有一个”测试:[60 x1双]偏见:-0.2999学习者:“支持向量机”属性,方法

IncrementalMdl.IsWarm

ans =逻辑1

增量模型是温暖的。因此,updateMetrics可以跟踪模型给定的性能指标数据。

跟踪性能指标

跟踪模型性能对其余数据使用updateMetrics函数。模拟数据流处理50观测一次。在每一次迭代:

调用updateMetrics更新和窗口分类累积误差模型的输入块的观察。覆盖前面的增量式模型更新的损失指标财产。注意,函数不符合模型的一部分数据,大部分是“新”的数据模型。
存储分类错误,第一个系数 $β_{1}$ 。

%预先配置idxil = ~ idxtt;nil =总和(idxil);numObsPerChunk = 50;nchunk =地板(nil / numObsPerChunk);ce = array2table (0 (nchunk, 2),“VariableNames”,(“累积”“窗口”]);beta1 = [IncrementalMdl.Beta (1);0 (nchunk 1)];自= X (idxil:);Yil = Y (idxil);%增量式拟合为j = 1: nchunk ibegin = min (nil, numObsPerChunk * (j - 1) + 1);iend = min (nil, numObsPerChunk * j);idx = ibegin: iend;IncrementalMdl = updateMetrics (IncrementalMdl自(idx:), Yil (idx));ce {j:} = IncrementalMdl.Metrics {“ClassificationError”,:};beta1 (j + 1) = IncrementalMdl.Beta (1);结束

IncrementalMdl是一个incrementalClassificationLinear模型对象,追踪观察的数据流模型的性能。

画一个跟踪性能指标和估计系数的情节 $β_{1}$ 。

t = tiledlayout (2, 1);nexttile h =情节(ce.Variables);xlim ([0 nchunk]) ylabel (分类错误的传奇(h, ce.Properties.VariableNames) nexttile情节(beta1) ylabel (“\ beta_1”)xlim ([0 nchunk])包含(t)“迭代”)

图包含2轴对象。坐标轴对象1包含2线类型的对象。这些对象代表累积,窗口。坐标轴对象2包含一个类型的对象。

累计损失是稳定的,而跳窗的损失。

$β_{1}$ 不会改变,因为updateMetrics不符合模型的数据。

配置跟踪性能指标增量式模型

打开生活的脚本

创建一个二进制增量线性支持向量机模型的分类。指定一个估计的5000年观察和SGD解算器。

Mdl = incrementalClassificationLinear (“EstimationPeriod”,5000,“规划求解”,“sgd”)

Mdl = incrementalClassificationLinear IsWarm: 0指标:[1 x2表]一会:[1 x0双]ScoreTransform:“没有一个”测试:[0 x1双]偏见:0学习者:“支持向量机”属性,方法

Mdl是一个incrementalClassificationLinear模型。所有的属性是只读的。

确定模型是温暖和度量的大小预热期通过查询模型属性。

isWarm = Mdl.IsWarm

isWarm =逻辑0

mwp = Mdl.MetricsWarmupPeriod

mwp = 1000

Mdl.IsWarm是0;因此,Mdl没有温暖。

确定数量的观察增量的拟合函数,如适合之前,必须处理测量模型的性能。

numObsBeforeMetrics = Mdl。指标WarmupPeriod + Mdl.EstimationPeriod

numObsBeforeMetrics = 6000

载入人类活动数据集。随机洗牌数据。

负载humanactivityn =元素个数(actid);rng (1)%的再现性idx = randsample (n, n);X =壮举(idx:);Y = actid (idx);

细节的数据集,输入描述在命令行中。

响应可以是五类:坐着,站着,散步,跑步,或者跳舞。二分响应通过识别主题是否移动(actid> 2)。

Y = Y > 2;

执行增量学习。在每一次迭代:

模拟数据流处理一块50的观察。
测量模型的性能指标的一部分使用updateMetrics。覆盖输入模型。
符合模型通过使用传入的一部分适合函数。覆盖输入模型。
商店 $β_{1}$ 和错误分类错误率,看看他们在增量学习发展。

%预先配置numObsPerChunk = 50;nchunk =地板(n / numObsPerChunk);ce = array2table (0 (nchunk, 2),“VariableNames”,(“累积”“窗口”]);beta1 = 0 (nchunk, 1);%增量式拟合为j = 1: nchunk ibegin = min (n, numObsPerChunk * (j - 1) + 1);iend = min (n, numObsPerChunk * j);idx = ibegin: iend;Mdl = updateMetrics (Mdl X (idx:), Y (idx));ce {j:} = Mdl.Metrics {“ClassificationError”,:};Mdl =适合(Mdl X (idx:), Y (idx));beta1 (j) = Mdl.Beta (1);结束

Mdl是一个incrementalClassificationLinear模型对象培训中的所有数据流。

在增量学习看到参数如何演变,把它们在不同的瓷砖。

t = tiledlayout (2, 1);nexttile情节(beta1) ylabel (“\ beta_1”)参照线(Mdl.EstimationPeriod / numObsPerChunk,r -。)包含(“迭代”)轴紧nexttile情节(ce.Variables) ylabel (“ClassificationError”)参照线(Mdl.EstimationPeriod / numObsPerChunk,r -。)参照线(numObsBeforeMetrics / numObsPerChunk,“g -”。)xlim ([0 nchunk])传说(ce.Properties.VariableNames)包含(t)“迭代”)

图包含2轴对象。坐标轴对象1包含2线类型的对象,constantline。轴2包含4线类型的对象,对象constantline。这些对象代表累积,窗口。

mdlIsWarm = numObsBeforeMetrics / numObsPerChunk

mdlIsWarm = 120

情节表明适合不符合模型的数据或更新之前的参数估计。同时,updateMetrics没有跟踪的分类误差估计和度量之前热身阶段(120块)。

执行条件的培训

打开生活的脚本

逐步培养一个线性回归模型只有当性能就会降低。

负载和洗牌2015年纽约市住房数据集。更多细节数据,看看纽约市公开的数据。

负载NYCHousing2015rng (1)%的再现性n =大小(NYCHousing2015, 1);shuffidx = randsample (n, n);NYCHousing2015 = NYCHousing2015 (shuffidx:);

提取反应变量SALEPRICE从表中。数值稳定、规模SALEPRICE通过1 e6。

Y = NYCHousing2015.SALEPRICE / 1 e6;NYCHousing2015。SALEPRICE = [];

创建虚拟变量分类预测矩阵。

catvars = [“区”“BUILDINGCLASSCATEGORY”“社区”];dumvarstbl = varfun (@ (x) dummyvar(分类(x)), NYCHousing2015,…“数据源”,catvars);dumvarmat = table2array (dumvarstbl);NYCHousing2015 (:, catvars) = [];

对所有其他表中的数值变量的线性预测销售价格。连接矩阵的虚变量的预测数据,和转置数据加速计算。

idxnum = varfun (@isnumeric NYCHousing2015,“OutputFormat”,“统一”);X = [dumvarmat NYCHousing2015 {:, idxnum}] ';

配置一个线性回归模型的增量学习,没有一个评估或量度的加热时间。指定一个指标1000观察的窗口大小。符合配置的模式第一个100年的观察,并指定观察是面向数据的列。

Mdl = incrementalRegressionLinear (“EstimationPeriod”0,“MetricsWarmupPeriod”0,…“MetricsWindowSize”,1000);numObsPerChunk = 100;Mdl =适合(Mdl X (: 1: numObsPerChunk), Y (1: numObsPerChunk),“ObservationsIn”,“列”);

Mdl是一个incrementalRegressionLinear模型对象。

执行增量学习,条件合适,每个迭代遵循这个过程:

模拟数据流处理一块100年的观察。
更新模型的性能计算ε不敏感损失,在200年的观察窗。指定的观测是面向列的数据。
符合模型的数据块只有在最小损失的损失超过双打有经验。指定的观测是面向列的数据。
当跟踪性能和装配,覆盖前面的增量式模型。
存储和ε不敏感损失 $β_{313年}$ 看到培训期间损失和系数如何演变。
跟踪时适合火车模型。

%预先配置n =元素个数(Y)——numObsPerChunk;nchunk =地板(n / numObsPerChunk);beta313 = 0 (nchunk, 1);ei = array2table (nan (nchunk, 2),“VariableNames”,(“累积”“窗口”]);训练= false (nchunk, 1);%增量式拟合为j = 2: nchunk ibegin = min (n, numObsPerChunk * (j - 1) + 1);iend = min (n, numObsPerChunk * j);idx = ibegin: iend;Mdl = updateMetrics (Mdl X (:, idx), Y (idx),“ObservationsIn”,“列”);ei {j:} = Mdl.Metrics {“EpsilonInsensitiveLoss”,:};minei = min (ei {: 2});pdiffloss = (ei {j 2} - minei) / minei * 100;如果pdiffloss > 100 Mdl =适合(Mdl X (:, idx), Y (idx),“ObservationsIn”,“列”);训练(j) = true;结束beta313 (j) = Mdl.Beta(结束);结束

Mdl是一个incrementalRegressionLinear模型对象培训中的所有数据流。

模型的性能和 $β_{313年}$ 进化在训练,放到单独的瓷砖。

t = tiledlayout (2, 1);nexttile情节(beta313)在情节(找到(训练),beta313(训练),“r”。)xlim ([0 nchunk]) ylabel (“\ beta_”{313})参照线(Mdl.EstimationPeriod / numObsPerChunk,r -。)传说(“\ beta_”{313},培训发生的,“位置”,“东南”)举行从nexttile情节(ei.Variables) xlim ([0 nchunk]) ylabel (“ε不敏感损失”)参照线(Mdl.EstimationPeriod / numObsPerChunk,r -。传奇(ei.Properties.VariableNames)包含(t)“迭代”)

$图包含2轴对象。坐标轴对象1包含3线类型的对象,constantline。这些对象代表\ beta_{313}、培训。轴2包含3线类型的对象,对象constantline。这些对象代表累积,窗口。$

跟踪的情节 $β_{313年}$ 显示时间的常量值,最小的损失没有双有经验。

输入参数

全部折叠

`Mdl`- - - - - -增量学习模型
`incrementalClassificationLinear`模型对象|`incrementalRegressionLinear`模型对象

增量学习模型的性能测量,指定为一个incrementalClassificationLinear或incrementalRegressionLinear模型对象。您可以创建Mdl直接或通过转换支持,传统上使用训练有素的机器学习模型金宝appincrementalLearner函数。更多细节,请参阅相应的引用页面。

如果Mdl.IsWarm是假,updateMetrics没有跟踪的性能模型。你必须适应Mdl来Mdl.EstimationPeriod+ Mdl.MetricsWarmupPeriod通过观察Mdl和数据适合之前updateMetrics可以跟踪性能指标。更多细节,请参阅性能指标。

`X`- - - - - -块的预测数据
浮点矩阵

块的预测数据测量模型的性能,指定为一个浮点矩阵n观察和Mdl.NumPredictors预测变量。的值ObservationsIn名称-值参数确定变量和观测的方向。默认的ObservationsIn值是“行”,这表明观察预测数据是面向的行X。

观察标签的长度Y和观察的数量X必须是相等的;Y (j)观察的标签吗j(行或列)X。

请注意

如果Mdl.NumPredictors= 0,updateMetrics推断预测的数量X,并设置相应的属性的输出模型。否则,如果流数据中预测变量的数量变化Mdl.NumPredictors,updateMetrics一个错误的问题。
updateMetrics金宝app只支持浮点输入预测数据。如果你的输入数据包括分类数据,您必须准备一个编码版本的分类数据。使用dummyvar每个分类变量转换为一个数字矩阵的虚变量。然后,连接所有哑变量矩阵和任何其他数值预测。更多细节,请参阅虚拟变量。

数据类型:单|双

`Y`- - - - - -块的反应(标签)
分类数组|字符数组|字符串数组|逻辑向量|浮点矢量|单元阵列的特征向量

块的反应(标签)来测量模型性能,指定分类,字符,或字符串数组,逻辑或浮点向量,或单元阵列的特征向量分类问题;或一个浮点向量回归问题。

观察标签的长度Y和观察的数量X必须是相等的;Y (j)观察的标签吗j(行或列)X。

对于分类问题:

updateMetrics金宝app只支持二进制分类。
当一会输入模型的属性Mdl非空的,适用下列条件:
- 如果Y包含一个标签,它不是一个成员Mdl.ClassNames,updateMetrics一个错误的问题。
- 的数据类型Y和Mdl.ClassNames必须相同。

数据类型:字符|字符串|细胞|分类|逻辑|单|双

请注意

如果一个观察(预测或标签)或重量包含至少一个失踪(南)的值,updateMetrics忽略了观察。因此,updateMetrics使用不到n性能计算模型,观察n观察的数量吗X。

名称-值参数

指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

例子:“ObservationsIn”、“列”、“重量”,W指定的列预测矩阵对应于观测,和向量W在增量学习包含观察权重应用。

`ObservationsIn`- - - - - -预测数据观察维度
`“行”`(默认)|`“列”`

预测数据观察维度,指定为逗号分隔组成的“ObservationsIn”和“列”或“行”。

数据类型:字符|字符串

`权重`- - - - - -块的观察权重
浮点矢量的积极的价值观

块的观察重量、指定为逗号分隔组成的“重量”和一个浮点矢量的积极的价值观。updateMetrics重的观察X与相应的值权重。的大小权重必须等于n,这是观察的数量X。

默认情况下,权重是(n,1)。

更多细节,包括标准化方案,请参阅观察权重。

数据类型:双|单

输出参数

全部折叠

`Mdl`——更新增量学习模型
`incrementalClassificationLinear`模型对象|`incrementalRegressionLinear`模型对象

增量学习模型更新,作为增量学习模型对象返回相同的数据类型作为输入模型Mdl,要么incrementalClassificationLinear或incrementalRegressionLinear。

如果模型没有温暖,updateMetrics不计算性能指标。结果,指标的属性Mdl是完全由南值。如果模型是温暖的,updateMetrics计算累积和窗口性能指标的新数据X和Y,覆盖相应的元素Mdl.Metrics。所有其他的属性输入模型Mdl带入输出模型Mdl。更多细节,请参阅性能指标。

提示

与传统的培训、增量学习可能没有一个单独的测试(抵抗)。因此,将每个传入的数据作为测试集,通过增量式模型和每个传入的块updateMetrics在训练模型相同的数据使用适合。

算法

全部折叠

性能指标

updateMetrics只跟踪模型性能指标,表的行指定的标签Mdl.Metrics当增量式模型,从新的数据温暖的(IsWarm属性是真正的)。增量模型后温暖适合函数的增量式模型Mdl.MetricsWarmupPeriod观察,这是度量预热期。
如果Mdl.EstimationPeriod> 0,hyperparameters估计函数拟合模型的数据。因此,必须处理一个额外的功能EstimationPeriod观察模型开始前预热期的指标。
的指标增量模型的属性存储两种形式的各性能指标作为一个表的变量(列),累积和窗口行,个别指标。当增量模型是温暖的,updateMetrics在以下的频率更新指标:
- 累积——函数计算累积度量模型以来的跟踪性能。功能更新指标每次你叫它和基地提供的计算对整个数据集。
- 窗口——函数计算指标基于观测由在一个窗口Mdl.MetricsWindowSize财产。Mdl.MetricsWindowSize也决定了软件更新的频率窗口指标。例如,如果Mdl.MetricsWindowSize是20,函数计算指标根据过去的20的观察提供的数据(X((结束- 20 + 1):,:)和Y((- 20 + 1)结束:结束))。
  增量跟踪性能指标的函数在一个窗口中使用以下过程:
  1. 存储一个缓冲区的长度Mdl.MetricsWindowSize为每个指定的度量,并存储一个缓冲区的观察权重。
  2. 填充的元素指标基于批次缓冲与模型性能的观察,并存储相应的权重观察权重缓冲区。
  3. 当缓冲区满,覆盖Mdl.Metrics.Window窗口的加权平均性能指标。如果缓冲区溢出时,函数过程一批观察,最新的传入Mdl.MetricsWindowSize观察输入缓冲区,和最早的观察从缓冲区中删除。例如,假设Mdl.MetricsWindowSize是20,缓冲区的指标有10个值从一个以前批处理,和15值传入的。组成20窗口长度,函数使用的测量15传入的观察和最新5测量前一批。
省略了一个观察的软件南预测(得分为分类和响应回归)计算累积和窗口性能度量值。

观察权重

对于分类问题,如果之前类概率分布是已知的(换句话说,先验分布不是经验),updateMetrics规范化观察权重总和之前类概率在各自的类。这个动作意味着观察权重前各自的默认类概率。

回归问题或者类概率分布是经验之前,软件可实现指定观察权重之和为1每次调用updateMetrics。

扩展功能

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。

使用笔记和限制:

使用saveLearnerForCoder,loadLearnerForCoder,codegen(MATLAB编码器)生成的代码updateMetrics函数。通过使用保存训练模型saveLearnerForCoder。定义一个入口点函数,通过使用加载保存模型loadLearnerForCoder并调用updateMetrics函数。然后使用codegen入口点函数来生成代码。
生成单精度C / c++代码updateMetrics,指定名称参数“数据类型”、“单身”当你打电话给loadLearnerForCoder函数。

此表包含的参数updateMetrics。参数不包括在这个表是完全支持。金宝app

论点笔记和局限性

论点	笔记和局限性
`Mdl`	使用notes和限制的模型对象,明白了`incrementalClassificationLinear`或`incrementalRegressionLinear`。
`X`	批次,观测的数量可以是一个变量的大小,但必须等于观测的数量`Y`。预测变量的数目必须相等`Mdl.NumPredictors`。 `X`必须`单`或`双`。
`Y`	批次,观测的数量可以是一个变量的大小,但必须等于观测的数量`X`。对于分类问题,所有的标签`Y`必须在`Mdl.ClassNames`。 `Y`和`Mdl.ClassNames`必须具有相同的数据类型。

Mdl

使用notes和限制的模型对象,明白了incrementalClassificationLinear或incrementalRegressionLinear。

X

批次,观测的数量可以是一个变量的大小,但必须等于观测的数量Y。
预测变量的数目必须相等Mdl.NumPredictors。
X必须单或双。

Y

批次,观测的数量可以是一个变量的大小,但必须等于观测的数量X。
对于分类问题,所有的标签Y必须在Mdl.ClassNames。
Y和Mdl.ClassNames必须具有相同的数据类型。

以下限制:
- 如果您配置Mdl洗牌数据(Mdl.Shuffle是真正的,或Mdl.Solver是“sgd”或“asgd”),updateMetrics函数随机打乱每个传入批观测之前,适合批量模型。的顺序打乱观察MATLAB生成的顺序可能不匹配^®。因此,如果你健康Mdl之前更新的性能指标,指标计算在MATLAB计算生成的代码可能不相等。
- 使用齐次所有浮点数据类型的输入参数和对象属性,具体地说,单或双。

有关更多信息,请参见介绍代码生成。

版本历史

介绍了R2020b

另请参阅

对象

incrementalClassificationLinear|incrementalRegressionLinear

功能

updateMetricsAndFit|适合|损失

updateMetrics

语法

描述

例子

增量模型的跟踪性能

配置跟踪性能指标增量式模型

执行条件的培训

输入参数

Mdl- - - - - -增量学习模型incrementalClassificationLinear模型对象|incrementalRegressionLinear模型对象

X- - - - - -块的预测数据浮点矩阵

Y- - - - - -块的反应(标签)分类数组|字符数组|字符串数组|逻辑向量|浮点矢量|单元阵列的特征向量

名称-值参数

ObservationsIn- - - - - -预测数据观察维度“行”(默认)|“列”

权重- - - - - -块的观察权重浮点矢量的积极的价值观

输出参数

Mdl——更新增量学习模型incrementalClassificationLinear模型对象|incrementalRegressionLinear模型对象

提示

算法

性能指标

观察权重

扩展功能

C / c++代码生成生成C和c++代码使用MATLAB®编码器™。

版本历史

另请参阅

对象

功能

主题

`Mdl`- - - - - -增量学习模型
`incrementalClassificationLinear`模型对象|`incrementalRegressionLinear`模型对象

`X`- - - - - -块的预测数据
浮点矩阵

`Y`- - - - - -块的反应(标签)
分类数组|字符数组|字符串数组|逻辑向量|浮点矢量|单元阵列的特征向量

`ObservationsIn`- - - - - -预测数据观察维度
`“行”`(默认)|`“列”`

`权重`- - - - - -块的观察权重
浮点矢量的积极的价值观

`Mdl`——更新增量学习模型
`incrementalClassificationLinear`模型对象|`incrementalRegressionLinear`模型对象

C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。