主要内容

分类线性代码配置器

用于高维数据的线性二进制分类的编码器配置器

描述

一种分类线性代码配置器对象是线性分类模型的编码器配置器(分类线性)用于高维数据的二进制分类。

编码器配置器提供方便的功能来配置代码生成选项,在生成的代码中生成C / C ++代码和更新模型参数。

  • 配置代码生成选项,并使用对象属性指定线性模型参数的编码器属性。

  • 生成C/ c++代码预测更新使用线性分类模型的功能generateCode.生成C/ c++代码需要MATLAB®编码器™

  • 更新生成的C/ c++代码中的模型参数,而不需要重新生成代码。当您使用新数据或设置重新训练线性模型时,该特性减少了重新生成、重新部署和重新验证C/ c++代码所需的工作。在更新模型参数之前,请使用验证更新输入验证并提取要更新的模型参数。

此流程图显示了使用编码器配置器的代码生成工作流。

两个代码生成工作流:第一个是在培训模型后生成的,第二个是在重新培训同一模型后生成的。第一个工作流,步骤1:创建编码器配置器。步骤2:生成代码。步骤3:验证生成的代码。第二个工作流,步骤1:检查更新是否有效。如果是,请转至步骤2;如果否,请转至第一个工作流的第一步。步骤2:更新生成代码中的模型参数。

对于代码生成使用说明和线性分类模型的限制,请参阅代码生成部分分类线性预测更新

创建

在训练线性分类模型后,使用fitclinear,使用以下方法为模型创建一个编码器配置器LearnerCoder配置器.使用编码器配置器的属性指定编码器属性预测更新参数。然后,用generateCode基于指定的编码器属性生成C / C ++代码。

属性

全部展开

预测参数

属性的编码器属性预测生成的代码中的函数参数。

预测器数据的编码器属性将传递给生成的C / C ++代码预测线性分类模型的函数,指定为LearnerCoderInput对象

使用创建编码器配置器时LearnerCoder配置器函数,输入参数X确定的默认值LearnerCoderInput编码器属性:

  • 秘诀—默认值为输入的数组大小X

    • 如果价值的属性ObservationsIn财产分类线性代码配置器'行'那么这一点秘诀价值是[n p],在那里N对应观察数和P.对应于预测值的数量。

    • 如果价值的属性ObservationsIn财产分类线性代码配置器'列'那么这一点秘诀价值是[p n]

    改变…的元素秘诀(例如,改变[n p][p n]),修改价值的属性ObservationsIn财产分类线性代码配置器因此。你无法修改秘诀直接价值。

  • VariableDimensions—默认值为[0 0],表示数组大小是固定的,如中所指定秘诀

    您可以将此值设置为[1 0]如果秘诀价值是[n p][0 1]如果它是[p n],表示数组具有大小可变的行和大小固定的列。例如,[1 0]指定第一个值秘诀N)是行数的上限,第二个值是秘诀P.)为列数。

  • 数据类型—取值为。默认数据类型取决于输入的数据类型X

  • 可调性- 这个值必须是符合事实的,意思是预测在生成的C/ c++代码中总是包含预测器数据作为输入。

您可以使用点表示法修改编码器属性。例如,要生成接受带有三个预测变量(列)的100个观察值的预测数据的C/ c++代码,指定这些编码器属性X用于编码器配置器配置器

configuration . x . sizevector = [100 3];configurer.X.DataType =“双”;configurer.X.VariableDimensions=[0];
[0 0]表示的第一个和第二个维度X(观察数和预测变量数分别)具有固定大小。

要允许生成的C/C++代码接受最多100个观测值的预测器数据,请指定X

configuration . x . sizevector = [100 3];configurer.X.DataType =“双”;configurer.X.VariableDimensions = [1 0];
[1 0]表示的第一个维度X(观察次数)具有可变大小和X(预测变量的数量)有一个固定的大小。在本例中,指定的观察数(100)成为生成的C/ c++代码中允许的最大观察数。若要允许任意数量的观察,请指定范围为Inf

预测器数据观察维度的编码器属性(“观测信号”的名称-值对参数预测),指定为EnumeratedInput对象

使用创建编码器配置器时LearnerCoder配置器函数,“观测信号”名称 - 值对参数确定默认值EnumeratedInput编码器属性:

  • 价值-默认值是创建编码器配置器时使用的预测器数据观察维度,指定为'行''列'.如果没有指定“观测信号”在创建编码器配置器时,默认值为'行'

  • SelectedOption-此值始终为'内置'。此属性是只读的。

  • BuiltInOptions- 细胞阵列'行''列'。此属性是只读的。

  • IsConstant- 这个值必须是符合事实的

  • 可调性-默认值为如果您指定“ObservationsIn”、“行”当创建编码器配置器时,和符合事实的如果您指定“ObservationsIn”、“列”.如果你设置可调性,该软件集价值'行'.如果指定其他属性值可调性,该软件集可调性符合事实的

要从生成的C/C++代码返回的输出参数数预测线性分类模型的功能,指定为1或2。

的输出参数预测标签(预测类标签)和分数(分类分数),按顺序排列。预测在生成的C/ c++代码中返回第一个N输出的预测功能,在哪里Nnumoutput.价值

在创建编码器配置器之后配置器,您可以使用点表示法指定输出的数量。

configurer.numOutputs = 2;

numoutput.属性等价于“-nargout”编译器选项codegen(MATLAB编码器).此选项指定代码生成的入口点函数中的输出参数数量。对象功能generateCode生成两个入口点函数predict.mupdate.m对于预测更新并为这两个入口点函数生成C/ c++代码。的指定值numoutput.属性对应于入口点函数中的输出参数数量predict.m

数据类型:

更新参数

属性的编码器属性更新生成的代码中的函数参数更新函数接受训练过的模型和新的模型参数作为输入参数,并返回包含新参数的模型的更新版本。要启用更新生成代码中的参数,您需要在生成代码之前指定参数的编码器属性。使用一个LearnerCoderInput对象指定每个参数的编码器属性。默认属性值基于输入参数中的模型参数Mdl属于LearnerCoder配置器

线性预测系数的编码器属性(贝塔的线性分类模型),指定为LearnerCoderInput对象

默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于LearnerCoder配置器

  • 秘诀- 这个值必须是[p 1],在那里P.是中预测值的数量Mdl

  • VariableDimensions- 这个值必须是[0 0],表示数组大小是固定的,如秘诀

  • 数据类型—取值为“单一”“双”这个default data type is consistent with the data type of the training data you use to trainMdl

  • 可调性- 这个值必须是符合事实的

偏差项的编码属性(偏见的线性分类模型),指定为LearnerCoderInput对象

默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于LearnerCoder配置器

  • 秘诀- 这个值必须是[1]

  • VariableDimensions- 这个值必须是[0 0],表示数组大小是固定的,如秘诀

  • 数据类型—取值为“单一”“双”这个default data type is consistent with the data type of the training data you use to trainMdl

  • 可调性- 这个值必须是符合事实的

分类成本的编码器属性(费用的线性分类模型),指定为LearnerCoderInput对象

默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于LearnerCoder配置器

  • 秘诀- 这个值必须是(2 - 2)

  • VariableDimensions- 这个值必须是[0 0],表示数组大小是固定的,如秘诀

  • 数据类型—取值为“单一”“双”这个default data type is consistent with the data type of the training data you use to trainMdl

  • 可调性—默认值为符合事实的

先验概率的编码属性(先前的的线性分类模型),指定为LearnerCoderInput对象

默认属性值LearnerCoderInput对象是基于输入参数的Mdl属于LearnerCoder配置器

  • 秘诀- 这个值必须是(1 2)

  • VariableDimensions- 这个值必须是[0 0],表示数组大小是固定的,如秘诀

  • 数据类型—取值为“单一”“双”这个default data type is consistent with the data type of the training data you use to trainMdl

  • 可调性—默认值为符合事实的

其他配置程序选项

生成的C/ c++代码的文件名,指定为字符向量。

对象功能generateCode属于分类线性代码配置器使用此文件名生成C/ c++代码。

文件名不能包含空格,因为在某些操作系统配置中,空格可能导致代码生成失败。此外,名称必须是有效的MATLAB函数名。

在创建编码器配置器之后配置器,可以使用点表示法指定文件名。

configurer.OutputFileName=“我的模型”

数据类型:字符

详细级别,指定为符合事实的(逻辑1)或(逻辑0)。详细级别控制命令行处的通知消息的显示。

价值 描述
符合事实的(逻辑1) 当您对参数的编码器属性的更改导致其他相关参数的更改时,该软件将显示通知消息。
(逻辑0) 该软件不显示通知消息。

要在生成的代码中启用更新机器学习模型参数,需要在生成代码之前配置参数的编码器属性。参数的编码属性彼此依赖,因此软件将依赖关系存储为配置约束。如果您使用编码器配置器修改参数的编码器属性,并且该修改需要随后更改其他相关参数以满足配置约束,则软件将更改相关参数的编码器属性。详细级别决定软件是否为这些后续更改显示通知消息。

在创建编码器配置器之后配置器,您可以使用点表示法修改详细程度。

配置。详细的= false;

数据类型:逻辑

代码生成自定义选项

要自定义代码生成工作流,请使用生成菲尔斯功能和以下三个属性codegen(MATLAB编码器),而不是使用generateCode函数。

生成两个入口点函数文件后(predict.mupdate.m)通过使用生成菲尔斯函数,您可以根据代码生成工作流修改这些文件。例如,可以修改predict.m文件要包含数据预处理,或者您可以将这些入口函数添加到另一个代码生成项目。然后,您可以通过使用C / C ++代码来生成C / C ++代码codegen(MATLAB编码器)功能与功能codegen适合于修改的入口点函数或代码生成项目的参数。使用本节中描述的三个属性作为起点来设置codegen参数。

此属性是只读的。

codegen(MATLAB编码器)参数,指定为单元格数组。

此属性使您可以自定义代码生成工作流程。使用generateCode如果不需要自定义工作流,则可以使用此函数。

而不是使用generateCode使用编码器配置器配置器,你可以生成C/ c++代码如下:

generatefiles(configurer)cgargs = configurer.codegeNerationArguments;Codegen(CGARGS {:})
如果自定义代码生成工作流,请修改cgArgs在打电话之前codegen

修改的其他属性配置器,则软件更新CodeGenerationArguments相应的财产。

数据类型:细胞

此属性是只读的。

入口点函数的可调输入参数列表predict.m对于代码生成,指定为单元格数组。单元格数组包含另一个单元格数组,其中包括编码原语类型(MATLAB编码器)对象和编码器。常数(MATLAB编码器)对象。

如果修改的编码器属性预测论据,则软件相应更新相应对象。如果指定可调性属性是,则该软件从预测inppuls.列表。

单元格数组预测inppuls.相当于配置。CodeGenerationArguments {6}用于编码器配置器配置器

数据类型:细胞

此属性是只读的。

入口点函数的可调输入参数列表update.m对于代码生成,指定为包含的结构的单元格数组编码原语类型(MATLAB编码器)对象。每个编码原语类型对象包括可调机器学习模型参数的编码器属性。

如果您使用编码器配置器属性修改模型参数的编码器属性(更新参数属性),然后软件更新相应的编码原语类型相应的对象。如果指定可调性机器学习模型参数的属性为,则软件删除相应的编码原语类型对象的updateInputs.列表。

的结构updateInputs.相当于configurer.CodeGeneratorGuments{3}用于编码器配置器配置器

数据类型:细胞

对象的功能

generateCode 使用编码器配置程序生成C / C ++代码
生成菲尔斯 生成MATLAB使用编码器配置程序的代码生成文件
验证更新输入 验证并提取机器学习模型参数进行更新

例子

全部折叠

训练一个机器学习模型,然后生成代码预测更新通过使用编码器配置器来实现模型的功能。

加载电离层数据集,并训练一个二元线性分类模型。传递转置的预测矩阵Xnewfitclinear,并使用“观测信号”的列的名称-值对参数指定Xnew对应于观测。

负载电离层Xnew=X';Mdl=fitclinear(Xnew,Y,“观测信号”'列');

Mdl是一个分类线性对象

控件创建一个编码器配置器分类线性模型通过使用LearnerCoder配置器.指定预测器数据Xnew,并使用“观测信号”的名称-值对参数,以指定的观察维度Xnew这个LearnerCoder配置器函数使用这些输入参数配置相应的输入参数的编码器属性预测

配置= learnerCoderConfigurer (Mdl Xnew,“观测信号”'列'
配置器=具有属性的ClassificationLinearCodeConfiguration:更新输入:Beta:[1x1 LearnerCoderInput]偏差:[1x1 LearnerCoderInput]优先级:[1x1 LearnerCoderInput]成本:[1x1 LearnerCoderInput]预测输入:X:[1x1 LearnerCoderInput]观测值In:[1x1 EnumeratedInput]代码生成参数:NumOutputs:1 OutputFileName:“ClassificationLinearModel”属性、方法

配置器是一个分类线性代码配置器对象的编码配置器分类线性对象

要生成C/C++代码,您必须能够访问正确配置的C/C++编译器。MATLAB Coder查找并使用受支持的已安装编译器。您可以使用金宝app墨西哥设置查看和更改默认编译器。有关详细信息,请参见更改默认编译器

为此生成代码预测更新线性分类模型的功能(Mdl)。

生成代码(配置器)
generateCode在输出文件夹中创建这些文件:米”、“预测。米”、“更新。米”、“ClassificationLinearModel。代码生成成功。

generateCode函数完成这些动作:

  • 生成MATLAB文件所需的生成代码,包括两个入口点函数predict.mupdate.m对于预测更新的功能Mdl, 分别。

  • 创建一个名为ClassificationLinearModel对于两个入口点函数。

  • 创建MEX函数的代码codegen\mex\ClassificationLinearModel文件夹中。

  • 将MEX函数复制到当前文件夹。

显示的内容predict.mupdate.m初始化.m文件,使用类型函数。

类型predict.m
函数varargout=predict(X,varargin)%#codegen%由MATLAB自动生成,2021年9月1日14:41:50[varargout{1:nargout}]=initialize('predict',X,varargin{:});结束
类型update.m
function update(varargin) %#codegen % Autogenerated by MATLAB, 01- 9 -2021 14:41:50 initialize('update',varargin{:});结束
类型初始化.m
function [varargout] = initialize(command,varargin) %#codegen % Autogenerated by MATLAB, 01- 9 -2021 14:41:50 code .inline('always') persistent model if isempty(model) model = loadLearnerForCoder('ClassificationLinearModel.mat');end switch(command) case 'update' % update struct fields: Beta % Bias % Prior % Cost model = update(model,varargin{:});case 'predict' %预测输入:X, ObservationsIn X = varargin{1};if nargout == 2 [varargout{1:nargout}] = predict(model,X);else PVPairs = cell(1,nargin-2);for i = 1:nargin-2 PVPairs{1,i} = varargin{i+1};end [varargout{1:nargout}] = predict(model,X,PVPairs{:});结束结束结束

使用部分数据集训练线性分类模型,并为模型创建编码器配置器。使用编码器配置器的属性来指定线性模型参数的编码器属性。使用编码器配置器的对象函数生成C代码,用于预测新的预测数据的标签。然后使用整个数据集重新训练模型,并在不重新生成代码的情况下更新生成代码中的参数。

列车模型

加载电离层数据集。这个数据集有34个预测器和351个雷达回波的二进制响应,或者是坏的(“b”)还是好(‘g’)。使用一半的观察来培训二进制线性分类模型。转换预测器数据,并使用“观测信号”的列的名称-值对参数指定XTrain对应于观测。

负载电离层rng(“默认”%的再现性n=长度(Y);c=分区(Y,“坚持”,0.5);Idxtrain =培训(C,1);xtrain = x(idxtrain,:)';YTrain = Y(IDxtrain);mdl = fitClinear(Xtrain,Ytrain,“观测信号”'列');

Mdl是一个分类线性对象

创建编码器配置

控件创建一个编码器配置器分类线性模型通过使用LearnerCoder配置器.指定预测器数据XTrain,并使用“观测信号”的名称-值对参数,以指定的观察维度XTrain这个LearnerCoder配置器函数使用这些输入参数配置相应的输入参数的编码器属性预测.此外,将输出的数量设置为2,以便生成的代码返回预测的标签和分数。

配置= learnerCoderConfigurer (Mdl XTrain,“观测信号”'列'“NumOutputs”2);

配置器是一个分类线性代码配置器对象的编码配置器分类线性对象

指定参数的编码器属性

指定线性分类模型参数的编码器属性,以便在再培训模型后更新生成的代码中的参数。此示例指定要传递给生成的代码的预测器数据的编码器属性。

指定代码的编码器属性X的属性配置器这样生成的代码就可以接受任意数量的观察。修改秘诀VariableDimensions属性。这秘诀属性指定预测器数据大小的上限,而VariableDimensions属性指定预测器数据的每个维度是否具有可变大小或固定大小。

configurer.X.SizeVector=[34 Inf];configurer.X.VariableDimensions
ans =1x2逻辑阵列0 1

第一维度的大小是预测变量的数量。必须为机器学习模型固定此值。因为预测器数据包含34个预测因子,所以秘诀属性的值必须为34VariableDimensions属性必须是0.

第二个维度的大小是观察的次数。的值秘诀属性来Inf使软件更改VariableDimensions属性来1.换句话说,大小的上限是Inf它的大小是可变的,这意味着预测数据可以有任意数量的观测数据。如果您在生成代码时不知道观察的数量,那么这个规范很方便。

尺寸的顺序秘诀VariableDimensions取决于的编码器属性ObservationsIn

configur.observationsin.
ans = EnumeratedInput带有属性:Value: 'columns' SelectedOption: ' built ' BuiltInOptions: {'rows' 'columns'} IsConstant: 1可调性:1

价值的属性ObservationsIn财产是'列'的第一个维度秘诀VariableDimensions的属性X对应于预测器的数量,第二维度对应于观测值的数量价值的属性ObservationsIn'行',维度的顺序被交换了。

生成代码

要生成C/C++代码,您必须能够访问正确配置的C/C++编译器。MATLAB Coder查找并使用受支持的已安装编译器。您可以使用金宝app墨西哥设置查看和更改默认编译器。有关详细信息,请参见更改默认编译器

为此生成代码预测更新线性分类模型的功能(Mdl)。

生成代码(配置器)
generateCode在输出文件夹中创建这些文件:米”、“预测。米”、“更新。米”、“ClassificationLinearModel。代码生成成功。

generateCode函数完成这些动作:

  • 生成MATLAB文件所需的生成代码,包括两个入口点函数predict.mupdate.m对于预测更新的功能Mdl, 分别。

  • 创建一个名为ClassificationLinearModel对于两个入口点函数。

  • 创建MEX函数的代码codegen\mex\ClassificationLinearModel文件夹中。

  • 将MEX函数复制到当前文件夹。

验证生成的代码

通过一些预测数据来验证是否预测的函数Mdl预测函数中返回相同的标签。要在具有多个入口点的MEX函数中调用入口点函数,请将函数名指定为第一个输入参数。

[标签,分数] =预测(MDL,XTrain,“观测信号”'列');[label_mex,score_mex] = classificedlinearmodel(“预测”,XTrain,“观测信号”'列');

比较标签标签通过使用是平等的

label_mex isequal(标签)
ans =逻辑1

是平等的返回逻辑1(符合事实的),如果所有输入相等。比较证实了预测的函数Mdl预测函数中返回相同的标签。

比较分数得分_mex.

max(abs(score-score_mex),[],“所有”
ans = 0

一般来说,得分_mex.可能包括舍入差异与分数.在本例中,比较证实了这一点分数得分_mex.是相等的。

重新训练模型并更新生成代码中的参数

使用整个数据集重新培训模型。

retrainedMdl = fitclinear (X, Y)“观测信号”'列');

使用提取要更新的参数验证更新输入.该函数检测修改后的模型参数retrainedMdl并验证修改后的参数值是否满足参数的编码器属性。

params = validatedUpdateInputs(配置、retrainedMdl);

更新生成代码中的参数。

ClassificationLinearModel (“更新”params)

验证生成的代码

比较来自预测的函数retrainedMdl预测函数。

(标签,分数)=预测(retrainedMdl X ',“观测信号”'列');[label_mex,score_mex] = classificedlinearmodel(“预测”X ',“观测信号”'列');label_mex isequal(标签)
ans =逻辑1
max(abs(score-score_mex),[],“所有”
ans = 0

比较证实了标签标签是相等的,并且得分值是相等的。

更多关于

全部展开

在R2019B中介绍