预测线性分类模型的标签
Mdl
- - - - - -二元线性分类模型ClassificationLinear
模型对象二元线性分类模型,指定为ClassificationLinear
模型对象。您可以创建一个ClassificationLinear
模型对象使用fitclinear
。
X
- - - - - -预测分类数据预测数据分类,指定为一个完整的或稀疏的数字矩阵或表。
默认情况下,每一行X
对应于一个观察,每一列对应一个变量。
一个数字矩阵:
变量的列X
必须有相同的订单预测变量,训练吗Mdl
。
如果你训练Mdl
使用一个表(例如,资源描述
),资源描述
只包含数字预测变量,然后X
可以是一个数字矩阵。将数值预测资源描述
分类在训练、识别分类预测使用CategoricalPredictors
名称-值对的观点fitclinear
。如果资源描述
包含了异构预测变量(例如,数字和分类数据类型)X
是一个数字矩阵,然后呢预测
抛出一个错误。
一个表:
预测
不支持多列变量或细金宝app胞数组以外的细胞阵列的特征向量。
如果你训练Mdl
使用一个表(例如,资源描述
),那么所有的预测变量X
必须有相同的变量名和数据类型的变量训练吗Mdl
(存储在Mdl.PredictorNames
)。然而,列的顺序X
不需要对应的列顺序资源描述
。同时,资源描述
和X
可以包含额外的变量(响应变量,观察体重、等等),但预测
忽略了它们。
如果你训练Mdl
使用一个数字矩阵,然后预测名称Mdl.PredictorNames
必须与相应的预测变量的名字X
。使用指定预测名称在训练PredictorNames
名称-值对的观点fitclinear
。所有的预测变量X
必须是数值向量。X
可以包含额外的变量(响应变量,观察体重、等等),但预测
忽略了它们。
请注意
如果你东方预测矩阵,以便观察并指定对应列“ObservationsIn”、“列”
,那么你可能会经历显著减少优化执行时间。你不能指定“ObservationsIn”、“列”
预测数据表。
数据类型:表
|双
|单
维
- - - - - -预测数据观察维度“行”
(默认)|“列”
预测数据观察维度,指定为“列”
或“行”
。
请注意
如果你东方预测矩阵,以便观察并指定对应列“ObservationsIn”、“列”
,那么你可能会经历显著减少优化执行时间。你不能指定“ObservationsIn”、“列”
预测数据表。
加载NLP数据集。
负载nlpdata
X
是一个稀疏矩阵的预测数据,Y
是一个分类向量类的标签。有两个以上的类的数据。
模型应该确定是否这个词项在一个web页面的统计和机器学习工具箱™文档。所以,确定对应的标签统计和机器学习的工具箱™文档web页面。
Ystats = Y = =“统计数据”;
火车一个二进制,线性分类模型使用整个数据集,可以识别词项在文档web页面是否从统计和机器学习工具箱™文档。
rng (1);%的再现性Mdl = fitclinear (X, Ystats);
Mdl
是一个ClassificationLinear
模型。
预测推理、resubstitution标签。
标签=预测(Mdl X);
因为有一个正规化的力量Mdl
,标签
列向量的长度等于观测的数量。
构造一个混淆矩阵。
ConfusionTrain = confusionchart (Ystats、标签);
模型分类只有一个“统计数据”
外的文档页面作为统计和机器学习工具箱文档。
加载NLP数据集进行预处理,如预测推理标签。转置矩阵的预测数据。
负载nlpdataYstats = Y = =“统计数据”;X = X ';
火车一个二进制,线性分类模型,该模型可以确定这个词项在文档web页面是否从统计和机器学习工具箱™文档。指定坚持30%的观察。使用SpaRSA优化目标函数。
rng (1)%的再现性Ystats CVMdl = fitclinear (X,“规划求解”,“sparsa”,“坚持”,0.30,…“ObservationsIn”,“列”);Mdl = CVMdl.Trained {1};
CVMdl
是一个ClassificationPartitionedLinear
模型。它包含属性训练有素的
,这是一个1×1单元阵列举行ClassificationLinear
使用训练集模型的软件培训。
从分区中提取的训练和测试数据的定义。
trainIdx =培训(CVMdl.Partition);testIdx =测试(CVMdl.Partition);
预测的训练和测试样本的标签。
labelTrain =预测(Mdl X (:, trainIdx),“ObservationsIn”,“列”);labelTest =预测(Mdl X (:, testIdx),“ObservationsIn”,“列”);
因为有一个正规化的力量Mdl
,labelTrain
和labelTest
列向量的长度等于数量的训练和测试观察,分别。
训练数据构建一个混淆矩阵。
ConfusionTrain = confusionchart (Ystats (trainIdx) labelTrain);
模型分类只有三个文档页面统计和机器学习的工具箱作为外部文档。
构造一个混淆矩阵的测试数据。
ConfusionTest = confusionchart (Ystats (testIdx) labelTest);
模型分类三个文档页面外的统计和机器学习的工具箱,里面和两页。
估计测试样本,后类概率,确定模型的质量通过绘制ROC曲线。线性分类logistic回归模型返回后验概率的学习者。
加载NLP数据集进行预处理,如预测测试样本的标签。
负载nlpdataYstats = Y = =“统计数据”;X = X ';
分区数据随机分成训练集和测试集通过指定一个抵抗样本的30%。识别测试集指标。
本量利= cvpartition (Ystats,“坚持”,0.30);idxTest =测试(cvp);
火车一个二进制线性分类模型。符合逻辑回归使用SpaRSA学习者。测试集的,指定分区模型。
Ystats CVMdl = fitclinear (X,“ObservationsIn”,“列”,“CVPartition”、本量利、…“学习者”,“物流”,“规划求解”,“sparsa”);Mdl = CVMdl.Trained {1};
Mdl
是一个ClassificationLinear
模型使用训练集训练中指定的分区本量利
只有。
概率预测试样后类。
[~,后]=预测(Mdl X (:, idxTest),“ObservationsIn”,“列”);
因为有一个正规化的力量Mdl
,后
是一个矩阵,2列和行等于测试集观测的数量。列我包含的后验概率Mdl.ClassNames(我)
给定一个特定的观察。
获得假和真阳性率,估计AUC。指定第二个类是积极的类。
(玻璃钢,tpr, ~, auc) = perfcurve (Ystats (idxTest)、后(:,2),Mdl.ClassNames (2));auc
auc = 0.9986
AUC是1
,这表明一个模型,该模型预测。
绘制ROC曲线。
图;甘氨胆酸的阴谋(玻璃钢,tpr) h =;h.XLim (1) = -0.1;h.YLim (2) = 1.1;包含(的假阳性率)ylabel (“真阳性率”)标题(“ROC曲线”)
中华民国曲线和AUC表明模型分类测试样本观察几乎完全。
确定好lasso-penalty强度线性分类模型,使用逻辑回归的学习者,AUC的测试样本的值进行比较。
加载NLP的数据集,数据的预处理预测测试样本的标签。
负载nlpdataYstats = Y = =“统计数据”;X = X ';
创建一个指定的数据分区坚持10%的观察。提取测试样本指标。
rng (10);%的再现性分区= cvpartition (Ystats,“坚持”,0.10);testIdx =测试(分区);XTest = X (:, testIdx);n =总和(testIdx)
n = 3157
欧美= Ystats (testIdx);
有3157的观察测试样品。
创建一组11对数间隔正则化的优势 通过 。
-0.5λ= logspace(6日,11);
火车二进制,线性分类模型,使用每一种正则化的优势。使用SpaRSA优化目标函数。降低目标函数的梯度的宽容1 e-8
。
Ystats CVMdl = fitclinear (X,“ObservationsIn”,“列”,…“CVPartition”分区,“学习者”,“物流”,“规划求解”,“sparsa”,…“正规化”,“套索”,“λ”λ,“GradientTolerance”1 e-8)
CVMdl = ClassificationPartitionedLinear CrossValidatedModel:“线性”ResponseName:“Y”NumObservations: 31572 KFold: 1分区:[1 x1 cvpartition]类名:[0 1]ScoreTransform:“没有一个”属性,方法
提取训练线性分类模型。
Mdl1 = CVMdl.Trained {1}
Mdl1 = ClassificationLinear ResponseName:“Y”类名:[0 1]ScoreTransform:分对数的β:[34023 x11双]偏见:[-11.9423 -11.9423 -11.9423 -11.9423 -8.6627 -6.3558……λ:[1.0000 4.4668 1.2589 3.5481 e-06 e-06 e-05 e-05……学习者:“物流”属性,方法
Mdl
是一个ClassificationLinear
模型对象。因为λ
是一个序列的正则化的优势,你能想到什么Mdl
11岁的模型,每个正规化的力量在一个λ
。
估计测试样本预测类标签和后概率。
(标签,后)=预测(Mdl1 XTest,“ObservationsIn”,“列”);Mdl1.ClassNames;后(3、1、5)
ans = 1.0000
标签
3157 - 11矩阵的预测标签。每一列对应于模型的预测标签使用对应的正规化训练强度。后
是3157年由- 11 - 2矩阵后类的概率。列对应类和页面对应的正则化优势。例如,后(3、1、5)
表明,第一节课的后验概率(标签0
)是分配给观察3的模型使用λ(5)
作为一个正规化的力量是1.0000。
对于每个模型,计算出AUC。指定第二课堂积极类。
auc = 1:元素个数(λ);%预先配置为j = 1:元素个数(λ)[~,~,~,auc (j)] = perfcurve(欧美,后(:,2,j), Mdl1.ClassNames (2));结束
更高的值λ
导致预测变量较少,这是一个很好的分类器的质量。对于每一个正规化的力量,训练一个线性分类模型使用整个数据集和训练模型时相同的选项。确定数量的非零系数模型。
Mdl = fitclinear (X, Ystats“ObservationsIn”,“列”,…“学习者”,“物流”,“规划求解”,“sparsa”,“正规化”,“套索”,…“λ”λ,“GradientTolerance”1 e-8);numNZCoeff = (Mdl.Beta ~ = 0)之和;
在同一人物,情节的测试样本错误率和频率非零系数为每个正则化的力量。所有变量在对数尺度的阴谋。
图;[h, hL1, hL2] = plotyy (log10(λ)log10 (auc),…log10(λ)log10 (numNZCoeff + 1));hL1。标志=“o”;hL2。标志=“o”;ylabel (h (1),“log_ {10} AUC的)ylabel (h (2),“log_ {10} nonzero-coefficient频率”)包含(“log_{10}λ的)标题(测试样本统计的)举行从
选择平衡的正则化强度指数预测变量稀疏,AUC高。在这种情况下,一个值之间 来 应该足够了。
idxFinal = 9;
选择的模型Mdl
选择正则化的力量。
idxFinal MdlFinal = selectModels (Mdl);
MdlFinal
是一个ClassificationLinear
模型包含一个正规化的力量。为新观测估计标签,通过MdlFinal
和新数据预测
。
对于线性分类模型,原始分类分分类的观察x一个行向量,到积极的类定义
为模型和正则化的力量j,
估计系数列向量(模型属性β(:,j)
),
模型是估计,标量偏见(财产吗偏见(j)
)。
原始的分类分分类x到负类f(x)。软件将观察分为类,产生积极的分数。
如果逻辑回归的线性分类模型由学习者,那么软件应用分对数的
分数转换原始分类得分(见ScoreTransform
)。
使用笔记和限制:
您可以生成C / c++代码预测
和更新
通过使用一个编码器配置。或者,只生成代码预测
通过使用saveLearnerForCoder
,loadLearnerForCoder
,codegen
。
代码生成的预测
和更新
——创建一个编码器配置使用learnerCoderConfigurer
然后通过使用生成代码generateCode
。然后你可以更新模型参数生成的代码,而不必重新生成代码。
代码生成的预测
——保存一个训练有素的模型通过使用saveLearnerForCoder
。定义一个入口点函数,通过使用加载保存模型loadLearnerForCoder
并调用预测
函数。然后使用codegen
(MATLAB编码器)入口点函数来生成代码。
生成单精度C / c++代码预测
,指定名称参数“数据类型”、“单”
当你打电话给loadLearnerForCoder
函数。
此表包含的参数预测
。参数不包括在这个表是完全支持。金宝app
论点 | 笔记和局限性 |
---|---|
Mdl |
使用笔记和限制的模型对象,明白了代码生成的 |
X |
|
名称-值对的观点 |
|
有关更多信息,请参见介绍代码生成。
您有一张这本Beispiels geanderte版本。您这本Beispiel麻省理工学院古老Anderungen offnen吗?
您有窗户的链接geklickt,汪汪汪der diesem MATLAB-Befehl entspricht:
在das MATLAB-Befehlsfenster Fuhren您窝Befehl军队Eingabe来自。浏览器unterstutzen MATLAB-Befehle。
你也可以从下面的列表中选择一个网站:
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。