RegressionTreeCoderConfigurer
回归二叉决策树模型的编码器配置器
描述
一个RegressionTreeCoderConfigurer
对象是用于回归的二叉决策树模型的编码器配置器(RegressionTree
或CompactRegressionTree
).
编码器配置器提供了方便的功能来配置代码生成选项,生成C/ c++代码,并在生成的代码中更新模型参数。
配置代码生成选项,并使用对象属性为树模型参数指定编码器属性。
生成C/ c++代码
预测
而且更新
函数的回归树模型通过使用generateCode
.生成C/ c++代码需要MATLAB®编码器™.更新生成的C/ c++代码中的模型参数,而不必重新生成代码。当您使用新数据或设置重新训练树模型时,此特性减少了重新生成、重新部署和重新验证C/ c++代码所需的工作。在更新模型参数之前,使用
validatedUpdateInputs
验证并提取模型参数进行更新。
此流程图显示了使用编码器配置器的代码生成工作流。
的代码生成使用说明和回归树模型的限制,请参阅的代码生成部分CompactRegressionTree
,预测
,更新
.
创建
训练后的回归树模型通过使用fitrtree
,为模型创建编码器配置器learnerCoderConfigurer
.类的编码器属性预测
而且更新
参数。然后,用generateCode
根据指定的编码器属性生成C/ c++代码。
属性
预测
参数
属性的编码器属性预测
生成代码中的函数参数。
X
- - - - - -预测器数据的编码器属性
LearnerCoderInput
对象
编码器属性的预测器数据传递给生成的C/ c++代码预测
回归树模型的函数,指定为LearnerCoderInput
对象。
类创建编码器配置程序时learnerCoderConfigurer
函数,输入参数X
属性的默认值LearnerCoderInput
编码器属性:
SizeVector
—默认值为输入的数组大小X
.VariableDimensions
—该值为[0 0]
(默认)或[1 0]
.[0 0]
中指定的固定数组大小SizeVector
.[1 0]
指示数组具有可变大小的行和固定大小的列。的第一个值SizeVector
的上限是行数,第二个值是SizeVector
是列数。
数据类型
—该值为单
或双
.默认数据类型取决于输入的数据类型X
.可调谐性
—必须为真正的
,这意味着预测
在生成的C/ c++代码中总是包含预测器数据作为输入。
可以使用点表示法修改编码器属性。例如,要生成接受三个预测变量的100个观测值的预测器数据的C/ c++代码,请指定的编码器属性为X
对于编码器配置器配置
:
configuration . x . sizevector = [100 3];configurer.X.DataType =“双”;configuration . x . variabledimensions = [0 0];
[0 0]
的第一个和第二个维度X
(分别为观察数和预测变量数)具有固定的大小。
要允许生成的C/ c++代码接受最多100个观测值的预测器数据,请指定这些编码器属性X
:
configuration . x . sizevector = [100 3];configurer.X.DataType =“双”;configuration . x . variabledimensions = [10];
[1 0]
的第一个维度X
(观测数)具有可变大小和第二次维数X
(预测变量的数量)有固定的大小。指定的观察数(在本例中为100)成为生成的C/ c++代码中允许的最大观察数。若要允许任意数量的观察,请将边界指定为正
.
NumOutputs
- - - - - -输出数预测
1(默认)|2
类所生成的C/ c++代码返回的输出参数的个数预测
回归树模型的函数,指定为1或2。
的输出参数预测
是Yfit
(预测反应)和节点
(用于预测的节点号),按此顺序。预测
在生成的C/ c++代码中返回第一个n
本署的产出预测
函数,n
是NumOutputs
价值。
在创建编码器配置器之后配置
,您可以使用点表示法指定输出的数量。
配置。NumOutputs= 2;
的NumOutputs
属性等价于“-nargout”
编译器选项codegen
(MATLAB编码器).此选项指定代码生成的入口点函数中的输出参数数量。目标函数generateCode
生成两个入口点函数-predict.m
而且update.m
为预测
而且更新
函数的回归树模型,并为这两个入口点函数生成C/ c++代码。属性的指定值NumOutputs
属性对应于入口点函数中输出参数的数量predict.m
.
数据类型:双
更新
参数
属性的编码器属性更新
生成代码中的函数参数。的更新
函数接受一个训练过的模型和新的模型参数作为输入参数,并返回包含新参数的模型的更新版本。要在生成的代码中启用更新参数,您需要在生成代码之前指定参数的编码器属性。使用一个LearnerCoderInput
对象指定每个参数的编码器属性。默认属性值基于输入参数中的模型参数Mdl
的learnerCoderConfigurer
.
孩子们
- - - - - -每个节点的子节点的编码器属性
LearnerCoderInput
对象
树中每个节点的子节点的编码器属性(孩子们
的回归树模型),指定为LearnerCoderInput
对象。
属性的默认属性值LearnerCoderInput
对象的值均基于输入参数Mdl
的learnerCoderConfigurer
:
SizeVector
—默认值为(2 nd)
,在那里nd
节点个数是否到位Mdl
.VariableDimensions
—该值为[0 0]
(默认)或[1 0]
.[0 0]
中指定的固定数组大小SizeVector
.[1 0]
指示数组具有可变大小的行和固定大小的列。的第一个值SizeVector
的上限是行数,第二个值是SizeVector
是列数。
数据类型
—该值为“单一”
或“双”
.默认数据类型与用于训练的训练数据的数据类型一致Mdl
.可调谐性
—必须为真正的
.
的第一个维度SizeVector
是newnd
,然后软件修改的第一个维度SizeVector
属性为newnd
对于属性割点
,CutPredictorIndex
,NodeMean
.类似地,如果修改的第一个维度VariableDimensions
是1
,然后软件修改的第一个维度VariableDimensions
属性为1
对于这些性质。
割点
- - - - - -每个节点的切割点的编码器属性
LearnerCoderInput
对象
树中每个节点的切点的编码器属性(割点
的回归树模型),指定为LearnerCoderInput
对象。
属性的默认属性值LearnerCoderInput
对象的值均基于输入参数Mdl
的learnerCoderConfigurer
:
SizeVector
—默认值为(nd - 1)
,在那里nd
节点个数是否到位Mdl
.VariableDimensions
—该值为[0 0]
(默认)或[1 0]
.[0 0]
中指定的固定数组大小SizeVector
.[1 0]
指示数组具有可变大小的行和固定大小的列。的第一个值SizeVector
的上限是行数,第二个值是SizeVector
是列数。
数据类型
—该值为“单一”
或“双”
.默认数据类型与用于训练的训练数据的数据类型一致Mdl
.可调谐性
—必须为真正的
.
的第一个维度SizeVector
是newnd
,然后软件修改的第一个维度SizeVector
属性为newnd
对于属性孩子们
,CutPredictorIndex
,NodeMean
.类似地,如果修改的第一个维度VariableDimensions
是1
,然后软件修改的第一个维度VariableDimensions
属性为1
对于这些性质。
CutPredictorIndex
- - - - - -每个节点的剪切预测器索引的编码器属性
LearnerCoderInput
对象
树中每个节点的剪切预测器索引的编码器属性(CutPredictorIndex
的回归树模型),指定为LearnerCoderInput
对象。
属性的默认属性值LearnerCoderInput
对象的值均基于输入参数Mdl
的learnerCoderConfigurer
:
SizeVector
—默认值为(nd - 1)
,在那里nd
节点个数是否到位Mdl
.VariableDimensions
—该值为[0 0]
(默认)或[1 0]
.[0 0]
中指定的固定数组大小SizeVector
.[1 0]
指示数组具有可变大小的行和固定大小的列。的第一个值SizeVector
的上限是行数,第二个值是SizeVector
是列数。
数据类型
—该值为“单一”
或“双”
.默认数据类型与用于训练的训练数据的数据类型一致Mdl
.可调谐性
—必须为真正的
.
的第一个维度SizeVector
是newnd
,然后软件修改的第一个维度SizeVector
属性为newnd
对于属性孩子们
,割点
,NodeMean
.类似地,如果修改的第一个维度VariableDimensions
是1
,然后软件修改的第一个维度VariableDimensions
属性为1
对于这些性质。
NodeMean
- - - - - -每个节点的平均响应值的编码器属性
LearnerCoderInput
对象
树中每个节点的平均响应值的编码器属性(NodeMean
的回归树模型),指定为LearnerCoderInput
对象。
属性的默认属性值LearnerCoderInput
对象的值均基于输入参数Mdl
的learnerCoderConfigurer
:
SizeVector
—默认值为(nd - 1)
,在那里nd
节点个数是否到位Mdl
.VariableDimensions
—该值为[0 0]
(默认)或[1 0]
.[0 0]
中指定的固定数组大小SizeVector
.[1 0]
指示数组具有可变大小的行和固定大小的列。的第一个值SizeVector
的上限是行数,第二个值是SizeVector
是列数。
数据类型
—该值为“单一”
或“双”
.默认数据类型与用于训练的训练数据的数据类型一致Mdl
.可调谐性
—必须为真正的
.
的第一个维度SizeVector
是newnd
,然后软件修改的第一个维度SizeVector
属性为newnd
对于属性孩子们
,割点
,CutPredictorIndex
.类似地,如果修改的第一个维度VariableDimensions
是1
,然后软件修改的第一个维度VariableDimensions
属性为1
对于这些性质。
其他配置选项
OutputFileName
- - - - - -生成的C/ c++代码的文件名
“RegressionTreeModel”
(默认)|特征向量
生成的C/ c++代码的文件名,指定为字符向量。
目标函数generateCode
的RegressionTreeCoderConfigurer
使用此文件名生成C/ c++代码。
文件名不能包含空格,因为在某些操作系统配置中,空格可能导致代码生成失败。此外,名称必须是有效的MATLAB函数名。
在创建编码器配置器之后配置
,可以使用点表示法指定文件名。
配置。OutputFileName =“myModel”;
数据类型:字符
详细的
- - - - - -冗长的水平
真正的
(逻辑1)(默认)|假
(逻辑0)
详细级别,指定为真正的
(逻辑1)或假
(逻辑0).详细级别控制命令行上通知消息的显示。
价值 | 描述 |
---|---|
真正的 (逻辑1) |
当对参数的编码器属性的更改导致其他依赖参数的更改时,软件将显示通知消息。 |
假 (逻辑0) |
该软件不显示通知消息。 |
要在生成的代码中更新机器学习模型参数,需要在生成代码之前配置参数的编码器属性。参数的编码器属性相互依赖,因此软件将依赖关系存储为配置约束。如果您使用编码器配置器修改一个参数的编码器属性,并且修改需要后续更改其他相关参数以满足配置约束,那么软件将更改相关参数的编码器属性。详细级别决定软件是否显示这些后续更改的通知消息。
在创建编码器配置器之后配置
,可以使用点表示法修改详细级别。
配置。详细的= false;
数据类型:逻辑
代码生成自定义选项
要自定义代码生成工作流,请使用generateFiles
函数与下面三个属性相结合codegen
(MATLAB编码器),而不是使用generateCode
函数。
生成两个入口点函数文件后(predict.m
而且update.m
)使用generateFiles
函数,您可以根据代码生成工作流修改这些文件。例如,可以修改predict.m
文件中包含数据预处理,或者可以将这些入口点函数添加到另一个代码生成项目中。方法生成C/ c++代码codegen
(MATLAB编码器)功能和codegen
参数适用于修改后的入口点函数或代码生成项目。使用本节中描述的三个属性作为设置属性的起点codegen
参数。
CodeGenerationArguments
- - - - - -codegen
参数
单元阵列
此属性是只读的。
codegen
(MATLAB编码器)参数,指定为单元格数组。
此属性使您能够自定义代码生成工作流。使用generateCode
函数,如果您不需要自定义工作流。
而不是使用generateCode
使用编码器配置器配置
,可以生成C/ c++代码,如下所示:
generateFiles(配置程序)cgArgs = configuration . codegenerationarguments;codegen (cgArgs {}):
cgArgs
因此,在打电话之前codegen
.
如果修改的其他属性配置
时,软件更新CodeGenerationArguments
相应的属性。
数据类型:细胞
PredictInputs
- - - - - -的输入参数预测
的单元格数组编码器。PrimitiveType
对象
此属性是只读的。
入口点函数的输入参数predict.m
的单元格数组指定,用于代码生成编码器。PrimitiveType
(MATLAB编码器)对象。的编码器。PrimitiveType
对象中存储的预测器数据的编码器属性X
财产。
如果您修改了预测器数据的编码器属性,则软件将更新编码器。PrimitiveType
相应的对象。
的编码器。PrimitiveType
对象PredictInputs
等于配置。CodeGenerationArguments {6}
对于编码器配置器配置
.
数据类型:细胞
UpdateInputs
- - - - - -的可调输入参数列表更新
单元格数组的结构包括编码器。PrimitiveType
对象
此属性是只读的。
入口点函数的可调输入参数列表update.m
用于代码生成,指定为包含的结构的单元格数组编码器。PrimitiveType
(MATLAB编码器)对象。每一个编码器。PrimitiveType
对象包含可调机器学习模型参数的编码器属性。
如果您使用编码器配置器属性(更新
参数属性),然后软件进行相应的更新编码器。PrimitiveType
相应的对象。如果您指定可调谐性
机器学习模型参数的属性为假
,然后软件删除相应的编码器。PrimitiveType
对象的UpdateInputs
列表。
的结构UpdateInputs
等于配置。CodeGenerationArguments {3}
对于编码器配置器配置
.
数据类型:细胞
对象的功能
generateCode |
使用编码器配置器生成C/ c++代码 |
generateFiles |
生成MATLAB使用编码器配置器生成代码的文件 |
validatedUpdateInputs |
验证并提取机器学习模型参数进行更新 |
例子
使用编码器配置器生成代码
训练一个机器学习模型,然后生成代码预测
而且更新
通过使用编码器配置器实现模型的功能。
加载carbig
数据集,其中包含汽车数据,并训练一个回归树模型。
负载carbigX =[排量马力重量];Y = mpg;Mdl = fitrtree(X,Y);
Mdl
是一个RegressionTree
对象。
属性的编码器配置程序RegressionTree
通过使用learnerCoderConfigurer
.指定预测器数据X
.的learnerCoderConfigurer
函数使用输入X
属性的编码器属性预测
函数的输入。
configurer = learnerCoderConfigurer(Mdl,X)
configurer = RegressionTreeCoderConfigurer with properties: Update input: Children: [1x1 LearnerCoderInput] NodeMean: [1x1 LearnerCoderInput] CutPoint: [1x1 LearnerCoderInput] CutPredictorIndex: [1x1 LearnerCoderInput] Predict input: X: [1x1 LearnerCoderInput]代码生成参数:NumOutputs: 1 OutputFileName: 'RegressionTreeModel'属性,方法
配置
是一个RegressionTreeCoderConfigurer
对象的编码器配置器RegressionTree
对象。
要生成C/ c++代码,您必须能够访问配置正确的C/ c++编译器。MATLAB Coder定位并使用支持的,已安装的编译器。金宝app你可以使用墨西哥人
设置
查看和更改默认编译器。详情请参见更改默认编译器.
为预测
而且更新
回归树模型的功能(Mdl
)。
generateCode(配置)
generateCode在output文件夹中创建这些文件:米”、“预测。米”、“更新。米”、“RegressionTreeModel。代码生成成功。
的generateCode
函数完成以下操作:
生成生成代码所需的MATLAB文件,包括两个入口点函数
predict.m
而且update.m
为预测
而且更新
的功能Mdl
,分别。创建一个名为
RegressionTreeModel
对于两个入口函数。中为MEX函数创建代码
codegen \墨西哥人\ RegressionTreeModel
文件夹中。将MEX函数复制到当前文件夹。
控件的内容predict.m
,update.m
,initialize.m
文件,使用类型
函数。
类型predict.m
函数varargout = predict(X,varargin) %#codegen %由MATLAB自动生成,26- 11月2022 10:10:10 [varargout{1:nargout}] =初始化('predict',X,varargin{:});结束
类型update.m
函数更新(varargin) %#codegen %由MATLAB自动生成,26-Nov-2022 10:10:10初始化('update',varargin{:});结束
类型initialize.m
function [varargout] = initialize(command,varargin) %#codegen %由MATLAB自动生成,26-Nov-2022 10:10:10 code .inline('always')持久化模型if isempty(模型)model = loadLearnerForCoder(' regressiontremodel .mat');end switch(command) case 'update' %更新结构字段:child % NodeMean % CutPoint % CutPredictorIndex model = update(model,varargin{:});预测输入:X X = varargin{1};if nargin == 2 [varargout{1:nargout}] = predict(模型,X);else PVPairs = cell(1,nargin-2);如果i = 1:nargin-2 pvairs {1,i} = varargin{i+1};end [varargout{1:nargout}] = predict(model,X,PVPairs{:});结束结束
生成代码中回归树模型参数的更新
使用部分数据集训练回归树,并为模型创建编码器配置器。使用编码器配置器的属性来指定模型参数的编码器属性。使用编码器配置器的object函数生成C代码,用于预测新预测器数据的响应。然后使用整个数据集重新训练模型,并在不重新生成代码的情况下更新生成代码中的参数。
火车模型
加载carbig
数据集,并训练回归树模型使用一半的观察。
负载carbigX =[排量马力重量];Y = mpg;rng (“默认”)%用于再现性n =长度(Y);idxTrain = randsample(n,n/2);XTrain = X(idxTrain,:);YTrain = Y(idxTrain);Mdl = fitrtree(XTrain,YTrain);
Mdl
是一个RegressionTree
对象。
创建编码器配置器
属性的编码器配置程序RegressionTree
通过使用learnerCoderConfigurer
.指定预测器数据XTrain
.的learnerCoderConfigurer
函数使用输入XTrain
属性的编码器属性预测
函数的输入。此外,将输出的数量设置为2,以便生成的代码返回预测的响应和预测的节点编号。
配置器= learnerCoderConfigurer(Mdl,XTrain,“NumOutputs”2);
配置
是一个RegressionTreeCoderConfigurer
对象的编码器配置器RegressionTree
对象。
指定参数的编码器属性
指定回归树模型参数的编码器属性,以便您可以在重新训练模型后更新生成代码中的参数。
属性的编码器属性X
的属性配置
这样生成的代码就可以接受任意数量的观察值。修改SizeVector
而且VariableDimensions
属性。的SizeVector
属性指定预测器数据大小的上限,而VariableDimensions
属性指定预测器数据的每个维度的大小是可变的还是固定的。
configuration . x . sizevector = [Inf 3];configurer.X.VariableDimensions
ans =1x2逻辑阵列1 0
第一个维度的大小是观测的数量。属性的值SizeVector
属性来正
的值导致软件更改VariableDimensions
属性来1
.换句话说,大小的上限是正
而且预测数据的大小是可变的,这意味着预测数据可以有任意数量的观测值。如果在生成代码时不知道观察数,则此规范非常方便。
第二个维度的大小是预测变量的数量。对于机器学习模型,这个值必须固定。由于预测器数据包含3个预测器,因此SizeVector
属性必须为3.
的值VariableDimensions
属性必须为0
.
如果您使用新的数据或不同的设置重新训练树模型,树中的节点数量可能会发生变化。的第一个维度SizeVector
属性,以便您可以更新生成的代码中的节点数:孩子们
,割点
,CutPredictorIndex
,或NodeMean
.然后软件会自动修改其他属性。
的第一个值SizeVector
属性。NodeMean
财产正
.软件修改SizeVector
而且VariableDimensions
的属性孩子们
,割点
,CutPredictorIndex
匹配树中节点数量的新上限。的第一个值VariableDimensions
的属性NodeMean
更改1
.
configuration . nodemean . sizevector = [Inf 1];
已修改子代的SizeVector属性以满足配置约束。已修改裁剪点的SizeVector属性以满足配置约束。已修改CutPredictorIndex的SizeVector属性以满足配置约束。已修改子项的VariableDimensions属性以满足配置约束。已修改裁剪点的VariableDimensions属性以满足配置约束。已修改CutPredictorIndex的VariableDimensions属性以满足配置约束。
configurer.NodeMean.VariableDimensions
ans =1x2逻辑阵列1 0
生成代码
要生成C/ c++代码,您必须能够访问配置正确的C/ c++编译器。MATLAB Coder定位并使用支持的,已安装的编译器。金宝app你可以使用墨西哥人
设置
查看和更改默认编译器。详情请参见更改默认编译器.
为预测
而且更新
回归树模型的功能(Mdl
).
generateCode(配置)
generateCode在output文件夹中创建这些文件:米”、“预测。米”、“更新。米”、“RegressionTreeModel。代码生成成功。
的generateCode
函数完成以下操作:
生成生成代码所需的MATLAB文件,包括两个入口点函数
predict.m
而且update.m
为预测
而且更新
的功能Mdl
,分别。创建一个名为
RegressionTreeModel
对于两个入口函数。中为MEX函数创建代码
codegen \墨西哥人\ RegressionTreeModel
文件夹中。将MEX函数复制到当前文件夹。
验证生成的代码
通过一些预测数据来验证是否正确预测
的函数Mdl
和预测
在MEX函数中的函数返回相同的预测响应。若要在具有多个入口点的MEX函数中调用入口点函数,请将函数名指定为第一个输入参数。
[Yfit,node] = predict(Mdl,XTrain);[Yfit_mex,node_mex] = RegressionTreeModel(“预测”, XTrain);
比较Yfit
来Yfit_mex
而且节点
来node_mex
.
马克斯(abs (Yfit-Yfit_mex), [],“所有”)
Ans = 0
node_mex isequal(节点)
ans =逻辑1
一般来说,Yfit_mex
可能包括四舍五入的差异比较Yfit
.在这种情况下,比较证实了这一点Yfit
而且Yfit_mex
是相等的。
isequal
返回逻辑1 (真正的
)如果所有输入参数都相等。这一比较证实了预测
的函数Mdl
和预测
函数返回相同的节点号。
重新训练模型和更新生成代码中的参数
使用整个数据集重新训练模型。
retrainedMdl = fitrtree(X,Y);
通过使用提取要更新的参数validatedUpdateInputs
.该函数检测中修改的模型参数retrainedMdl
并验证修改后的参数值是否满足参数的编码器属性。
params = validatedUpdateInputs(配置器,retrainedMdl);
更新生成代码中的参数。
RegressionTreeModel (“更新”params)
验证生成的代码
方法的输出参数进行比较预测
的函数retrainedMdl
和预测
在更新后的MEX函数中。
[Yfit,node] = predict(retrainedMdl,X);[Yfit_mex,node_mex] = RegressionTreeModel(“预测”, X);马克斯(abs (Yfit-Yfit_mex), [],“所有”)
Ans = 0
node_mex isequal(节点)
ans =逻辑1
结果表明,预测的响应和节点数是一致的。
更多关于
LearnerCoderInput
对象
编码器配置器使用LearnerCoderInput
对象指定的编码器属性预测
而且更新
输入参数。
一个LearnerCoderInput
对象具有以下属性,用于在生成的代码中指定输入参数数组的属性。
属性名称 | 描述 |
---|---|
SizeVector |
数组大小,如果对应 数组大小的上界,如果对应 |
VariableDimensions |
指示符,指定数组的每个维度是具有可变大小还是固定大小,指定为
|
数据类型 |
数组的数据类型 |
可调谐性 |
指示是否存在的指标 如果指定其他属性值时 |
创建编码器配置器后,可以使用点表示法修改编码器属性。属性的编码器属性割点
编码器配置程序的属性配置
:
configuration . cutpoint . sizevector = [40 1];configuration . cutpoint . variabledimensions = [1 0];
详细的
),真正的
(默认),则当您修改机器学习模型参数的编码器属性,且该修改更改了其他依赖参数的编码器属性时,软件将显示通知消息。
版本历史
R2019b引入
MATLAB命令
你点击了一个对应于这个MATLAB命令的链接:
在MATLAB命令窗口中输入该命令来运行该命令。Web浏览器不支持MATLAB命令。金宝app
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。