适合
火车线性模型的增量学习
描述
的适合
线性回归函数符合配置增量学习模型(incrementalRegressionLinear
(对象)或线性二元分类incrementalClassificationLinear
流数据对象)。此外跟踪性能指标使用数据到达时,使用updateMetricsAndFit
代替。
例子
逐步培养模型
创建一个默认为二进制增量线性支持向量机模型的分类。指定一个估计的5000年观察和SGD解算器。
Mdl = incrementalClassificationLinear (“EstimationPeriod”,5000,“规划求解”,“sgd”)
Mdl = incrementalClassificationLinear IsWarm: 0指标:[1 x2表]一会:[1 x0双]ScoreTransform:“没有一个”测试:[0 x1双]偏见:0学习者:“支持向量机”属性,方法
Mdl
是一个incrementalClassificationLinear
模型。所有的属性是只读的。
Mdl
必须适合数据之前,您可以使用它来执行任何其他操作。
载入人类活动数据集。随机洗牌数据。
负载humanactivityn =元素个数(actid);rng (1)%的再现性idx = randsample (n, n);X =壮举(idx:);Y = actid (idx);
细节的数据集,输入描述
在命令行中。
响应可以是五类:坐着,站着,散步,跑步,或者跳舞。二分响应通过识别主题是否移动(actid
> 2)。
Y = Y > 2;
适合的增量式模型训练数据,50块一次观测,通过使用适合
函数。在每一次迭代:
模拟数据流处理50个观察。
覆盖前面的增量式模型与一个新安装的观察。
商店 的训练观察和主题是否感动的先验概率(
Y
=真正的
在增量训练),看看他们如何演变。
%预先配置numObsPerChunk = 50;nchunk =地板(n / numObsPerChunk);beta1 = 0 (nchunk, 1);numtrainobs = 0 (nchunk, 1);priormoved = 0 (nchunk, 1);%增量式拟合为j = 1: nchunk ibegin = min (n, numObsPerChunk * (j - 1) + 1);iend = min (n, numObsPerChunk * j);idx = ibegin: iend;Mdl =适合(Mdl X (idx:), Y (idx));beta1 (j) = Mdl.Beta (1);numtrainobs (j) = Mdl.NumTrainingObservations;priormoved (j) = Mdl.Prior (Mdl。一会= = true);结束
Mdl
是一个incrementalClassificationLinear
模型对象培训中的所有数据流。
在增量学习看到参数如何演变,把它们在不同的瓷砖。
tiledlayout (2, 2) nexttile情节(beta1) ylabel (“\ beta_1”)参照线(Mdl.EstimationPeriod / numObsPerChunk,r -。)包含(“迭代”)轴紧nexttile情节(numtrainobs) ylabel (“数量的训练观察”)参照线(Mdl.EstimationPeriod / numObsPerChunk,r -。)包含(“迭代”)轴紧nexttile情节(priormoved) ylabel (‘\π(主题是移动))参照线(Mdl.EstimationPeriod / numObsPerChunk,r -。)包含(“迭代”)轴紧
情节表明适合
不符合模型的数据或更新之前的参数估计。
指定的方向观察和观察权重
火车二进制分类使用的线性模型fitclinear
,将它转换成一个增量学习,跟踪其性能,并适合流媒体数据。东方的观测列,并指定观察权重。
加载和数据预处理
载入人类活动数据集。随机洗牌数据。东方的观测指标数据列。
负载humanactivityrng (1);%的再现性n =元素个数(actid);idx = randsample (n, n);X =壮举(idx:)”;Y = actid (idx);
细节的数据集,输入描述
在命令行中。
响应可以是五类:坐着,站着,散步,跑步,或者跳舞。二分响应通过识别主题是否移动(actid
> 2)。
Y = Y > 2;
假设当主题是不动(收集的数据Y
=假
)质量比主题是移动时的两倍。创建一个重量变量属性2仍然从一个主题,收集的观察和1一个移动的主题。
W = 1 (n, 1) + Y ~;
为二进制分类培训线性模型
二进制分类符合线性模型的随机样本数据的一半。
idxtt = randsample((真假),n, true);TTMdl = fitclinear (X (:, idxtt), Y (idxtt),“ObservationsIn”,“列”,…“重量”W (idxtt))
TTMdl = ClassificationLinear ResponseName:“Y”类名:[0 1]ScoreTransform:“没有一个”测试:[60 x1双]偏见:-0.1107λ:8.2967 e-05学习者:“支持向量机”属性,方法
TTMdl
是一个ClassificationLinear
模型对象代表二进制分类的传统训练的线性模型。
转换训练模型
传统训练分类模型转换为一个二进制分类线性模型的增量学习。
IncrementalMdl = incrementalLearner (TTMdl)
IncrementalMdl = incrementalClassificationLinear IsWarm: 1指标:[1 x2表]一会:[0 1]ScoreTransform:“没有一个”测试:[60 x1双]偏见:-0.1107学习者:“支持向量机”属性,方法
分别跟踪性能指标和模型
对其余的数据执行增量学习使用updateMetrics
和适合
功能。在每一次迭代:
模拟数据流处理50观测一次。
调用
updateMetrics
更新和窗口分类累积误差模型的输入块的观察。覆盖前面的增量式模型更新的损失指标
财产。注意,函数不符合模型的一部分数据,大部分是“新”的数据模型。指定列的观测是面向,并指定观察权重。调用
适合
适合的模型输入块的观察。覆盖前面的增量式模型更新模型参数。指定列的观测是面向,并指定观察权重。存储分类错误,首先估计系数 。
%预先配置idxil = ~ idxtt;nil =总和(idxil);numObsPerChunk = 50;nchunk =地板(nil / numObsPerChunk);ce = array2table (0 (nchunk, 2),“VariableNames”,(“累积”“窗口”]);beta1 = [IncrementalMdl.Beta (1);0 (nchunk 1)];自= X (:, idxil);Yil = Y (idxil);会= W (idxil);%增量式拟合为j = 1: nchunk ibegin = min (nil, numObsPerChunk * (j - 1) + 1);iend = min (nil, numObsPerChunk * j);idx = ibegin: iend;IncrementalMdl = updateMetrics (IncrementalMdl自(:,idx) Yil (idx),…“ObservationsIn”,“列”,“重量”会(idx));ce {j:} = IncrementalMdl.Metrics {“ClassificationError”,:};IncrementalMdl =适合(IncrementalMdl自(:,idx) Yil (idx),“ObservationsIn”,“列”,…“重量”会(idx));beta1 (j + 1) = IncrementalMdl.Beta (1);结束
IncrementalMdl
是一个incrementalClassificationLinear
模型对象培训中的所有数据流。
或者,您可以使用updateMetricsAndFit
更新模型的性能指标给定一个新的数据块,然后适应模型数据。
画一个跟踪性能指标和估计系数的情节 。
t = tiledlayout (2, 1);nexttile h =情节(ce.Variables);xlim ([0 nchunk]) ylabel (分类错误的传奇(h, ce.Properties.VariableNames) nexttile情节(beta1) ylabel (“\ beta_1”)xlim ([0 nchunk])包含(t)“迭代”)
累计损失稳定和逐渐减少,而跳窗的损失。
逐渐改变,然后下降,适合
流程更块。
执行条件的培训
逐步培养一个线性回归模型只有当性能就会降低。
负载和洗牌2015年纽约市住房数据集。更多细节数据,看看纽约市公开的数据。
负载NYCHousing2015rng (1)%的再现性n =大小(NYCHousing2015, 1);shuffidx = randsample (n, n);NYCHousing2015 = NYCHousing2015 (shuffidx:);
提取反应变量SALEPRICE
从表中。数值稳定、规模SALEPRICE
通过1 e6
。
Y = NYCHousing2015.SALEPRICE / 1 e6;NYCHousing2015。SALEPRICE = [];
创建虚拟变量分类预测矩阵。
catvars = [“区”“BUILDINGCLASSCATEGORY”“社区”];dumvarstbl = varfun (@ (x) dummyvar(分类(x)), NYCHousing2015,…“数据源”,catvars);dumvarmat = table2array (dumvarstbl);NYCHousing2015 (:, catvars) = [];
对所有其他表中的数值变量的线性预测销售价格。连接矩阵的虚变量的预测数据。
idxnum = varfun (@isnumeric NYCHousing2015,“OutputFormat”,“统一”);X = [dumvarmat NYCHousing2015 {:, idxnum});
配置一个线性回归模型的增量学习,没有一个评估或量度的加热时间。指定一个指标窗口大小为1000。第一个100年观测符合配置的模型。
Mdl = incrementalRegressionLinear (“EstimationPeriod”0,…“MetricsWarmupPeriod”0,“MetricsWindowSize”,1000);numObsPerChunk = 100;Mdl =适合(Mdl X (1: numObsPerChunk,:), Y (1: numObsPerChunk));
Mdl
是一个incrementalRegressionLinear
模型对象。
执行增量学习,条件合适,每个迭代遵循这个过程:
模拟数据流处理一块100年的观察。
更新模型的性能计算ε不敏感损失,在200年的观察窗。
符合模型的数据块只有在最小损失的损失超过双打有经验。
当跟踪性能和装配,覆盖前面的增量式模型。
存储和ε不敏感损失 的损失和系数训练中发展。
跟踪时
适合
火车模型。
%预先配置n =元素个数(Y)——numObsPerChunk;nchunk =地板(n / numObsPerChunk);beta313 = 0 (nchunk, 1);ei = array2table (nan (nchunk, 2),“VariableNames”,(“累积”“窗口”]);训练= false (nchunk, 1);%增量式拟合为j = 2: nchunk ibegin = min (n, numObsPerChunk * (j - 1) + 1);iend = min (n, numObsPerChunk * j);idx = ibegin: iend;Mdl = updateMetrics (Mdl X (idx:), Y (idx));ei {j:} = Mdl.Metrics {“EpsilonInsensitiveLoss”,:};minei = min (ei {: 2});pdiffloss = (ei {j 2} - minei) / minei * 100;如果pdiffloss > 100 Mdl =适合(Mdl X (idx:), Y (idx));训练(j) = true;结束beta313 (j) = Mdl.Beta(结束);结束
Mdl
是一个incrementalRegressionLinear
模型对象培训中的所有数据流。
模型的性能和 进化在训练,放到单独的瓷砖。
t = tiledlayout (2, 1);nexttile情节(beta313)在情节(找到(训练),beta313(训练),“r”。)xlim ([0 nchunk]) ylabel (“\ beta_”{313})参照线(Mdl.EstimationPeriod / numObsPerChunk,r -。)传说(“\ beta_”{313},培训发生的,“位置”,“东南”)举行从nexttile情节(ei.Variables) xlim ([0 nchunk]) ylabel (“ε不敏感损失”)参照线(Mdl.EstimationPeriod / numObsPerChunk,r -。传奇(ei.Properties.VariableNames)包含(t)“迭代”)
跟踪的情节 显示时间的常量值,最小的损失没有双有经验。
输入参数
Mdl
- - - - - -增量学习模型
incrementalClassificationLinear
模型对象|incrementalRegressionLinear
模型对象
增量学习模型适合流媒体数据,指定为一个incrementalClassificationLinear
或incrementalRegressionLinear
模型对象。您可以创建Mdl
直接或通过转换支持,传统上使用训练有素的机器学习模型金宝appincrementalLearner
函数。更多细节,请参阅相应的引用页面。
X
- - - - - -块的预测数据
浮点矩阵
块的预测数据模型是合适的,指定为一个浮点矩阵n观察和Mdl.NumPredictors
预测变量。的值ObservationsIn
名称-值参数确定变量和观测的方向。默认的ObservationsIn
值是“行”
,这表明观察预测数据是面向的行X
。
观察标签的长度Y
和观察的数量X
必须是相等的;Y (
观察的标签吗j(行或列)j
)X
。
请注意
数据类型:单
|双
Y
- - - - - -块的反应(标签)
分类数组|字符数组|字符串数组|逻辑向量|浮点矢量|单元阵列的特征向量
请注意
如果一个观察(预测或标签)或重量包含至少一个失踪(
南
)的值,适合
忽略了观察。因此,适合
使用不到n观察到创建一个更新模型,n观察的数量吗X
。块的大小n随机梯度下降法(SGD) hyperparameter mini-batch大小(
Mdl.BatchSize
)可以不同的值n不需要一个精确的mini-batch大小的倍数。如果n<Mdl.BatchSize
,适合
使用n观察应用SGD时可用。如果n>Mdl.BatchSize
,函数更新模型的mini-batch多次指定的大小,然后使用其余的观察过去mini-batch。观察的数量在过去mini-batch可以小于Mdl.BatchSize
。
名称-值参数
指定可选的双参数作为Name1 = Value1,…,以=家
,在那里的名字
参数名称和吗价值
相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。
R2021a之前,用逗号来分隔每一个名称和值,并附上的名字
在报价。
例子:“ObservationsIn”、“列”、“重量”,W
指定的列预测矩阵对应于观测,和向量W
在增量学习包含观察权重应用。
输出参数
Mdl
——更新增量学习模型
incrementalClassificationLinear
模型对象|incrementalRegressionLinear
模型对象
增量学习模型更新,作为增量学习模型对象返回相同的数据类型作为输入模型Mdl
,要么incrementalClassificationLinear
或incrementalRegressionLinear
。
如果Mdl.EstimationPeriod
> 0,增量的拟合函数updateMetricsAndFit
和适合
估计hyperparameters使用第一Mdl.EstimationPeriod
观察传递给函数;他们不训练数据输入模型。然而,如果传入的一部分n观察是大于或等于估计时期观察剩余的数量米,适合
估计hyperparameters使用第一n- - - - - -米观察,和其余符合输入模型米观察。因此,软件更新β
和偏见
属性、hyperparameter属性和记录属性等NumTrainingObservations
。
对于分类问题,如果一会
输入模型的属性Mdl
是一个空数组,适合
设置一会
输出模型的属性Mdl
来独特的(Y)
。
提示
与传统的培训、增量学习可能没有一个单独的测试(抵抗)。因此,将每个传入的数据作为测试集,通过增量式模型和每个传入的块
updateMetrics
在训练模型相同的数据。
算法
观察权重
对于分类问题,如果之前类概率分布是已知的(换句话说,先验分布不是经验),适合
规范化观察权重总和之前类概率在各自的类。这个动作意味着观察权重前各自的默认类概率。
回归问题或者类概率分布是经验之前,软件可实现指定观察权重之和为1每次调用适合
。
扩展功能
C / c++代码生成
生成C和c++代码使用MATLAB®编码器™。
使用笔记和限制:
使用
saveLearnerForCoder
,loadLearnerForCoder
,codegen
(MATLAB编码器)生成的代码适合
函数。通过使用保存训练模型saveLearnerForCoder
。定义一个入口点函数,通过使用加载保存模型loadLearnerForCoder
并调用适合
函数。然后使用codegen
入口点函数来生成代码。生成单精度C / c++代码
适合
,指定名称参数“数据类型”、“单身”
当你打电话给loadLearnerForCoder
函数。此表包含的参数
适合
。参数不包括在这个表是完全支持。金宝app论点 笔记和局限性 Mdl
使用notes和限制的模型对象,明白了
incrementalClassificationLinear
或incrementalRegressionLinear
。X
批次,观测的数量可以是一个变量的大小,但必须等于观测的数量
Y
。预测变量的数目必须相等
Mdl.NumPredictors
。X
必须单
或双
。
Y
批次,观测的数量可以是一个变量的大小,但必须等于观测的数量
X
。对于分类问题,所有的标签
Y
必须在Mdl.ClassNames
。Y
和Mdl.ClassNames
必须具有相同的数据类型。
以下限制:
如果您配置
Mdl
洗牌数据(Mdl.Shuffle
是真正的
,或Mdl.Solver
是“sgd”
或“asgd”
),适合
函数随机打乱每个传入批观测之前,适合批量模型。的顺序打乱观察MATLAB生成的顺序可能不匹配®。因此,在MATLAB拟合系数计算和生成的代码可能不相等。使用齐次所有浮点数据类型的输入参数和对象属性,具体地说,
单
或双
。
有关更多信息,请参见介绍代码生成。
版本历史
MATLAB命令
你点击一个链接对应MATLAB命令:
运行该命令通过输入MATLAB命令窗口。Web浏览器不支持MATLAB命令。金宝app
你也可以从下面的列表中选择一个网站:
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。