主要内容

ClassificationLinearCoderConfigurer

用于高维数据线性二进制分类的编码器配置器

描述

一个ClassificationLinearCoderConfigurer对象是线性分类模型的编码器配置器(ClassificationLinear)用于高维数据的二元分类。

编码器配置器提供了方便的功能来配置代码生成选项,生成C/ c++代码,并在生成的代码中更新模型参数。

  • 配置代码生成选项,并使用对象属性指定线性模型参数的编码器属性。

  • 生成C/ c++代码预测而且更新函数的线性分类模型的运用generateCode.生成C/ c++代码需要MATLAB®编码器™

  • 更新生成的C/ c++代码中的模型参数,而不必重新生成代码。当您使用新的数据或设置重新训练线性模型时,此特性减少了重新生成、重新部署和重新验证C/ c++代码所需的工作。在更新模型参数之前,使用validatedUpdateInputs验证并提取模型参数进行更新。

此流程图显示了使用编码器配置器的代码生成工作流。

两个代码生成工作流:第一个在训练一个模型之后,第二个在重新训练同一个模型之后。第一个工作流,步骤1:创建一个编码器配置器。步骤2:生成代码。步骤3:验证生成的代码。第二个工作流,第1步:检查更新是否有效。是,执行步骤2;如果没有,请转到第一个工作流的第一步。步骤2:在生成的代码中更新模型参数。

有关线性分类模型的代码生成使用说明和限制,请参阅的代码生成部分ClassificationLinear预测,更新

创建

训练后建立线性分类模型fitclinear,为模型创建编码器配置器learnerCoderConfigurer.类的编码器属性预测而且更新参数。然后,用generateCode根据指定的编码器属性生成C/ c++代码。

属性

全部展开

预测参数

属性的编码器属性预测生成代码中的函数参数。

编码器属性的预测器数据传递给生成的C/ c++代码预测线性分类模型的函数,指定为LearnerCoderInput对象。

类创建编码器配置程序时learnerCoderConfigurer函数,输入参数X属性的默认值LearnerCoderInput编码器属性:

  • SizeVector—默认值为输入的数组大小X

    • 如果价值属性。ObservationsIn属性。ClassificationLinearCoderConfigurer“行”,然后这个SizeVector值是[n p],在那里n对应于观测数和p对应于预测器的数量。

    • 如果价值属性。ObservationsIn属性。ClassificationLinearCoderConfigurer“列”,然后这个SizeVector值是[p n]

    切换…的元素SizeVector(例如,改变[n p][p n]),修改价值属性。ObservationsIn属性。ClassificationLinearCoderConfigurer相应的行动。您不能修改SizeVector直接价值。

  • VariableDimensions—默认值为[0 0],表示数组大小固定SizeVector

    您可以将此值设置为[1 0]如果SizeVector值是[n p][0 1]如果是的话[p n],表示数组有可变大小的行和固定大小的列。例如,[1 0]的第一个值SizeVectorn)为行数的上限,为的第二个值SizeVectorp)为列数。

  • 数据类型—该值为.默认数据类型取决于输入的数据类型X

  • 可调谐性—必须为真正的,这意味着预测在生成的C/ c++代码中总是包含预测器数据作为输入。

可以使用点表示法修改编码器属性。例如,要生成接受三个预测变量(列)的100个观测值(行)的预测数据的C/ c++代码,指定的编码器属性为X对于编码器配置器配置

configuration . x . sizevector = [100 3];configurer.X.DataType =“双”;configuration . x . variabledimensions = [0 0];
[0 0]的第一个和第二个维度X(分别为观察数和预测变量数)具有固定的大小。

要允许生成的C/ c++代码接受最多100个观测值的预测器数据,请指定这些编码器属性X

configuration . x . sizevector = [100 3];configurer.X.DataType =“双”;configuration . x . variabledimensions = [10];
[1 0]的第一个维度X(观测数)具有可变大小和第二次维数X(预测变量的数量)有固定的大小。指定的观察数(在本例中为100)成为生成的C/ c++代码中允许的最大观察数。若要允许任意数量的观察,请将边界指定为

预测器数据观测维的编码器属性(“ObservationsIn”的名称-值对参数预测),指定为EnumeratedInput对象。

类创建编码器配置程序时learnerCoderConfigurer函数,“ObservationsIn”属性的默认值EnumeratedInput编码器属性:

  • 价值—默认值是您在创建编码器配置器时使用的预测器数据观察维度,指定为“行”“列”.如果您没有指定“ObservationsIn”在创建编码器配置器时,默认值为“行”

  • SelectedOption—该值为always“内置”.该属性是只读的。

  • BuiltInOptions-单元格阵列“行”而且“列”.该属性是只读的。

  • IsConstant—必须为真正的

  • 可调谐性- - - - - -默认值为如果你指定“ObservationsIn”、“行”在创建编码器配置程序时,和真正的如果你指定“ObservationsIn”、“列”.如果你设置可调谐性,软件集价值“行”.如果指定其他属性值时可调谐性,软件集可调谐性真正的

类所生成的C/ c++代码返回的输出参数的个数预测线性分类模型的函数,指定为1或2。

的输出参数预测标签(预测的类别标签)和分数(分类分数),按这个顺序。预测在生成的C/ c++代码中返回第一个n本署的产出预测函数,nNumOutputs价值。

在创建编码器配置器之后配置,您可以使用点表示法指定输出的数量。

配置。NumOutputs= 2;

NumOutputs属性等价于“-nargout”编译器选项codegen(MATLAB编码器).此选项指定代码生成的入口点函数中的输出参数数量。目标函数generateCode生成两个入口点函数-predict.m而且update.m预测而且更新函数的线性分类模型,并为这两个入口点函数生成C/ c++代码。属性的指定值NumOutputs属性对应于入口点函数中输出参数的数量predict.m

数据类型:

更新参数

属性的编码器属性更新生成代码中的函数参数。的更新函数接受一个训练过的模型和新的模型参数作为输入参数,并返回包含新参数的模型的更新版本。要在生成的代码中启用更新参数,您需要在生成代码之前指定参数的编码器属性。使用一个LearnerCoderInput对象指定每个参数的编码器属性。默认属性值基于输入参数中的模型参数MdllearnerCoderConfigurer

线性预测系数的编码器属性(β的线性分类模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象的值均基于输入参数MdllearnerCoderConfigurer

  • SizeVector—必须为(1页),在那里p预测因子的数量在吗Mdl

  • VariableDimensions—必须为[0 0],表示数组大小固定SizeVector

  • 数据类型—该值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为真正的

偏差项的编码器属性(偏见的线性分类模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象的值均基于输入参数MdllearnerCoderConfigurer

  • SizeVector—必须为[1]

  • VariableDimensions—必须为[0 0],表示数组大小固定SizeVector

  • 数据类型—该值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—必须为真正的

错误分类代价的编码器属性(成本的线性分类模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象的值均基于输入参数MdllearnerCoderConfigurer

  • SizeVector—必须为(2 - 2)

  • VariableDimensions—必须为[0 0],表示数组大小固定SizeVector

  • 数据类型—该值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—默认值为真正的

先验概率的编码器属性(之前的线性分类模型),指定为LearnerCoderInput对象。

属性的默认属性值LearnerCoderInput对象的值均基于输入参数MdllearnerCoderConfigurer

  • SizeVector—必须为(1 2)

  • VariableDimensions—必须为[0 0],表示数组大小固定SizeVector

  • 数据类型—该值为“单一”“双”.默认数据类型与用于训练的训练数据的数据类型一致Mdl

  • 可调谐性—默认值为真正的

其他配置选项

生成的C/ c++代码的文件名,指定为字符向量。

目标函数generateCodeClassificationLinearCoderConfigurer使用此文件名生成C/ c++代码。

文件名不能包含空格,因为在某些操作系统配置中,空格可能导致代码生成失败。此外,名称必须是有效的MATLAB函数名。

在创建编码器配置器之后配置,可以使用点表示法指定文件名。

配置。OutputFileName =“myModel”

数据类型:字符

详细级别,指定为真正的(逻辑1)或(逻辑0).详细级别控制命令行上通知消息的显示。

价值 描述
真正的(逻辑1) 当对参数的编码器属性的更改导致其他依赖参数的更改时,软件将显示通知消息。
(逻辑0) 该软件不显示通知消息。

要在生成的代码中更新机器学习模型参数,需要在生成代码之前配置参数的编码器属性。参数的编码器属性相互依赖,因此软件将依赖关系存储为配置约束。如果您使用编码器配置器修改一个参数的编码器属性,并且修改需要后续更改其他相关参数以满足配置约束,那么软件将更改相关参数的编码器属性。详细级别决定软件是否显示这些后续更改的通知消息。

在创建编码器配置器之后配置,可以使用点表示法修改详细级别。

配置。详细的= false;

数据类型:逻辑

代码生成自定义选项

要自定义代码生成工作流,请使用generateFiles函数与下面三个属性相结合codegen(MATLAB编码器),而不是使用generateCode函数。

生成两个入口点函数文件后(predict.m而且update.m)使用generateFiles函数,您可以根据代码生成工作流修改这些文件。例如,可以修改predict.m文件中包含数据预处理,或者可以将这些入口点函数添加到另一个代码生成项目中。方法生成C/ c++代码codegen(MATLAB编码器)功能和codegen参数适用于修改后的入口点函数或代码生成项目。使用本节中描述的三个属性作为设置属性的起点codegen参数。

此属性是只读的。

codegen(MATLAB编码器)参数,指定为单元格数组。

此属性使您能够自定义代码生成工作流。使用generateCode函数,如果您不需要自定义工作流。

而不是使用generateCode使用编码器配置器配置,可以生成C/ c++代码,如下所示:

generateFiles(配置程序)cgArgs = configuration . codegenerationarguments;codegen (cgArgs {}):
如果您自定义代码生成工作流,请修改cgArgs因此,在打电话之前codegen

如果修改的其他属性配置时,软件更新CodeGenerationArguments相应的属性。

数据类型:细胞

此属性是只读的。

入口点函数的可调输入参数列表predict.m用于代码生成,指定为单元格数组。单元格数组包含另一个单元格数组,包含编码器。PrimitiveType(MATLAB编码器)对象和编码器。常数(MATLAB编码器)对象。

的编码器属性预测参数,则软件将相应的对象进行更新。如果您指定可调谐性属性是,然后软件将对应的对象从PredictInputs列表。

中的单元格数组PredictInputs等于配置。CodeGenerationArguments {6}对于编码器配置器配置

数据类型:细胞

此属性是只读的。

入口点函数的可调输入参数列表update.m用于代码生成,指定为包含的结构的单元格数组编码器。PrimitiveType(MATLAB编码器)对象。每一个编码器。PrimitiveType对象包含可调机器学习模型参数的编码器属性。

如果您使用编码器配置器属性(更新参数属性),然后软件进行相应的更新编码器。PrimitiveType相应的对象。如果您指定可调谐性机器学习模型参数的属性为,然后软件删除相应的编码器。PrimitiveType对象的UpdateInputs列表。

的结构UpdateInputs等于配置。CodeGenerationArguments {3}对于编码器配置器配置

数据类型:细胞

对象的功能

generateCode 使用编码器配置器生成C/ c++代码
generateFiles 生成MATLAB使用编码器配置器生成代码的文件
validatedUpdateInputs 验证并提取机器学习模型参数进行更新

例子

全部折叠

训练一个机器学习模型,然后生成代码预测而且更新通过使用编码器配置器实现模型的功能。

加载电离层数据集,并训练一个二元线性分类模型。传递转置的预测矩阵Xnewfitclinear,并使用“ObservationsIn”的列Xnew与观察结果相对应。

负载电离层Xnew = X';Mdl = fitclinear(Xnew,Y,“ObservationsIn”“列”);

Mdl是一个ClassificationLinear对象。

属性的编码器配置程序ClassificationLinear通过使用learnerCoderConfigurer.指定预测器数据Xnew,并使用“ObservationsIn”的名称-值对参数指定的观测维度Xnew.的learnerCoderConfigurer函数使用这些输入参数来配置的相应输入参数的编码器属性预测

configurer = learnerCoderConfigurer(Mdl,Xnew,“ObservationsIn”“列”
配置器= ClassificationLinearCoderConfigurer属性:更新输入:Beta: [1x1 LearnerCoderInput]偏差:[1x1 LearnerCoderInput]先验:[1x1 LearnerCoderInput]成本:[1x1 LearnerCoderInput]预测输入:X: [1x1 LearnerCoderInput] ObservationsIn: [1x1 EnumeratedInput]代码生成参数:NumOutputs: 1 OutputFileName: 'ClassificationLinearModel'属性,方法

配置是一个ClassificationLinearCoderConfigurer对象的编码器配置器ClassificationLinear对象。

要生成C/ c++代码,您必须能够访问配置正确的C/ c++编译器。MATLAB Coder定位并使用支持的,已安装的编译器。金宝app你可以使用墨西哥人设置查看和更改默认编译器。详情请参见更改默认编译器

预测而且更新线性分类模型的功能(Mdl).

generateCode(配置)
generateCode在output文件夹中创建这些文件:米”、“预测。米”、“更新。米”、“ClassificationLinearModel。代码生成成功。

generateCode函数完成以下操作:

  • 生成生成代码所需的MATLAB文件,包括两个入口点函数predict.m而且update.m预测而且更新的功能Mdl,分别。

  • 创建一个名为ClassificationLinearModel对于两个入口函数。

  • 中为MEX函数创建代码codegen \墨西哥人\ ClassificationLinearModel文件夹中。

  • 将MEX函数复制到当前文件夹。

控件的内容predict.mupdate.m,initialize.m文件,使用类型函数。

类型predict.m
函数varargout = predict(X,varargin) %#codegen %由MATLAB自动生成,31 aug -2022 05:56:17 [varargout{1:nargout}] =初始化('predict',X,varargin{:});结束
类型update.m
函数更新(varargin) %#codegen %由MATLAB自动生成,31 aug -2022 05:56:17初始化('update',varargin{:});结束
类型initialize.m
function [varargout] = initialize(command,varargin) %#codegen %由MATLAB自动生成,31- august 2022 05:56:17 code .inline('always')持久化模型if isempty(model) model = loadLearnerForCoder('ClassificationLinearModel.mat');end switch(command) case 'update' %更新结构字段:Beta % Bias % Prior % Cost model = update(model,varargin{:});预测输入:X, ObservationsIn X = varargin{1};if nargin == 2 [varargout{1:nargout}] = predict(模型,X);else PVPairs = cell(1,nargin-2);如果i = 1:nargin-2 pvairs {1,i} = varargin{i+1};end [varargout{1:nargout}] = predict(model,X,PVPairs{:});结束结束

使用部分数据集训练线性分类模型,并为该模型创建编码器配置器。使用编码器配置器的属性指定线性模型参数的编码器属性。使用编码器配置器的object函数生成C代码,为新的预测器数据预测标签。然后使用整个数据集重新训练模型,并在不重新生成代码的情况下更新生成代码中的参数。

火车模型

加载电离层数据集。该数据集有34个预测器和351个雷达返回的二进制响应,要么是坏的(“b”)或好(‘g’).用一半的观测值训练一个二元线性分类模型。转置预测数据,并使用“ObservationsIn”的列XTrain与观察结果相对应。

负载电离层rng (“默认”%用于再现性n =长度(Y);c = cvpartition(Y,“坚持”, 0.5);idxTrain =训练(c,1);XTrain = X(idxTrain,:)';YTrain = Y(idxTrain);Mdl = fitclinear(XTrain,YTrain,“ObservationsIn”“列”);

Mdl是一个ClassificationLinear对象。

创建编码器配置器

属性的编码器配置程序ClassificationLinear通过使用learnerCoderConfigurer.指定预测器数据XTrain,并使用“ObservationsIn”的名称-值对参数指定的观测维度XTrain.的learnerCoderConfigurer函数使用这些输入参数来配置的相应输入参数的编码器属性预测.此外,将输出的数量设置为2,以便生成的代码返回预测的标签和分数。

配置器= learnerCoderConfigurer(Mdl,XTrain,“ObservationsIn”“列”“NumOutputs”2);

配置是一个ClassificationLinearCoderConfigurer对象的编码器配置器ClassificationLinear对象。

指定参数的编码器属性

指定线性分类模型参数的编码器属性,以便您可以在重新训练模型后更新生成代码中的参数。此示例指定要传递给生成代码的预测器数据的编码器属性。

属性的编码器属性X的属性配置这样生成的代码就可以接受任意数量的观察值。修改SizeVector而且VariableDimensions属性。的SizeVector属性指定预测器数据大小的上限,而VariableDimensions属性指定预测器数据的每个维度的大小是可变的还是固定的。

configuration . x . sizevector = [34 Inf];configurer.X.VariableDimensions
ans =1x2逻辑阵列0 1

第一个维度的大小是预测变量的数量。对于机器学习模型,这个值必须固定。由于预测器数据包含34个预测器,因此SizeVector属性的值必须为34VariableDimensions属性必须为0

第二个维度的大小是观测的数量。属性的值SizeVector属性来的值导致软件更改VariableDimensions属性来1.换句话说,大小的上限是而且预测数据的大小是可变的,这意味着预测数据可以有任意数量的观测值。如果在生成代码时不知道观察数,则此规范非常方便。

维度的顺序SizeVector而且VariableDimensions的编码器属性ObservationsIn

配置。ObservationsIn
ans = EnumeratedInput属性:值:'columns' SelectedOption: '内置' BuiltInOptions: {'rows' 'columns'} IsConstant: 1可调性:1

价值属性。ObservationsIn属性是“列”的第一个维度SizeVector而且VariableDimensions的属性X对应于预测因子的数量,第二个维度对应于观测值的数量。当价值的属性ObservationsIn“行”时,尺寸的顺序被切换。

生成代码

要生成C/ c++代码,您必须能够访问配置正确的C/ c++编译器。MATLAB Coder定位并使用支持的,已安装的编译器。金宝app你可以使用墨西哥人设置查看和更改默认编译器。详情请参见更改默认编译器

预测而且更新线性分类模型的功能(Mdl).

generateCode(配置)
generateCode在output文件夹中创建这些文件:米”、“预测。米”、“更新。米”、“ClassificationLinearModel。代码生成成功。

generateCode函数完成以下操作:

  • 生成生成代码所需的MATLAB文件,包括两个入口点函数predict.m而且update.m预测而且更新的功能Mdl,分别。

  • 创建一个名为ClassificationLinearModel对于两个入口函数。

  • 中为MEX函数创建代码codegen \墨西哥人\ ClassificationLinearModel文件夹中。

  • 将MEX函数复制到当前文件夹。

验证生成的代码

通过一些预测数据来验证是否正确预测的函数Mdl预测在MEX函数中的函数返回相同的标签。若要在具有多个入口点的MEX函数中调用入口点函数,请将函数名指定为第一个输入参数。

[label,score] = predict(Mdl,XTrain,“ObservationsIn”“列”);[label_mex,score_mex] = ClassificationLinearModel(“预测”XTrain,“ObservationsIn”“列”);

比较标签而且label_mex通过使用isequal

label_mex isequal(标签)
ans =逻辑1

isequal返回逻辑1 (真正的)如果所有输入都相等。这一比较证实了预测的函数Mdl预测在MEX函数中的函数返回相同的标签。

比较分数而且score_mex

马克斯(abs (score-score_mex), [],“所有”
Ans = 0

一般来说,score_mex可能包括四舍五入的差异比较分数.在这种情况下,比较证实了这一点分数而且score_mex是相等的。

重新训练模型和更新生成代码中的参数

使用整个数据集重新训练模型。

retrainedMdl = fitclinear(X',Y,“ObservationsIn”“列”);

通过使用提取要更新的参数validatedUpdateInputs.该函数检测中修改的模型参数retrainedMdl并验证修改后的参数值是否满足参数的编码器属性。

params = validatedUpdateInputs(配置器,retrainedMdl);

更新生成代码中的参数。

ClassificationLinearModel (“更新”params)

验证生成的代码

的输出进行比较预测的函数retrainedMdl预测在更新后的MEX函数中。

[label,score] = predict(retrainedMdl,X',“ObservationsIn”“列”);[label_mex,score_mex] = ClassificationLinearModel(“预测”X ',“ObservationsIn”“列”);label_mex isequal(标签)
ans =逻辑1
马克斯(abs (score-score_mex), [],“所有”
Ans = 0

这个比较证实了标签而且label_mex相等,并且分值相等。

更多关于

全部展开

版本历史

R2019b引入