石灰

局部可解释模型不可知解释(LIME)

描述

石灰通过寻找重要的预测器和拟合一个简单的可解释模型，解释机器学习模型(分类或回归)对查询点的预测。

您可以创建石灰对象用于具有指定查询点的机器学习模型(queryPoint)及指定数目的重要预测因素(numImportantPredictors)．该软件生成一个合成数据集，并拟合一个简单的可解释的重要预测器模型，有效地解释了查询点周围合成数据的预测。简单模型可以是线性模型(默认)或决策树模型。

使用拟合的简单模型在指定的查询点局部解释机器学习模型的预测。使用情节函数来可视化LIME结果。基于局部解释，您可以决定是否信任机器学习模型。

方法为另一个查询点拟合一个新的简单模型适合函数。

创建

语法

结果=石灰(黑盒子)

results = lime(blackbox,X)

results = lime(blackbox，'CustomSyntheticData'， CustomSyntheticData)

结果=石灰(___,‘QueryPoint QueryPoint NumImportantPredictors, NumImportantPredictors)

结果=石灰(___、名称、值)

描述

结果=石灰(黑箱）创建一个石灰对象使用机器学习模型对象黑箱其中包含预测数据。的石灰函数生成合成预测器数据集的样本，并计算样本的预测。要拟合一个简单模型，请使用适合函数与结果．

例子

结果=石灰(黑箱，X）创建一个石灰中的预测器数据X．

结果=石灰(黑箱“CustomSyntheticData”,customSyntheticData）创建一个石灰对象使用预生成的自定义合成预测器数据集customSyntheticData．的石灰函数计算样本的预测customSyntheticData．

例子

结果=石灰(___“QueryPoint”,queryPoint“NumImportantPredictors”,numImportantPredictors）找出指定数量的重要预测因子，并为查询点拟合一个简单的线性模型queryPoint．你可以指定queryPoint而且numImportantPredictors除了前面语法中的任何输入参数组合之外。

例子

结果=石灰(___，名称,值）使用一个或多个名称-值参数指定其他选项。例如,“SimpleModelType”、“树”将简单模型的类型指定为决策树模型。

输入参数

全部展开

`黑箱`- - - - - -有待解释的机器学习模型
回归模型对象|分类模型对象|函数处理

要解释的机器学习模型，指定为完整或紧凑的回归或分类模型对象或函数句柄。

完整或紧凑模型对象——您可以指定完整或紧凑的回归或分类模型对象，其中具有预测对象的功能。该软件使用预测函数计算查询点和合成预测器数据集的预测。

如果指定的模型对象不包含预测器数据(例如，紧凑模型)，则必须使用X或customSyntheticData．
石灰不支持用稀疏矩阵训金宝app练的模型对象。训练模型时，对预测器数据使用完整的数字矩阵或表，其中行对应于单个观察结果。

回归模型对象

金宝app支持模型	完整或紧凑回归模型对象
回归模型集合	`RegressionEnsemble`，`RegressionBaggedEnsemble`，`CompactRegressionEnsemble`
采用随机特征展开的高斯核回归模型	`RegressionKernel`
高斯过程回归	`RegressionGP`，`CompactRegressionGP`
广义加性模型	`RegressionGAM`，`CompactRegressionGAM`
高维数据的线性回归	`RegressionLinear`
神经网络回归模型	`RegressionNeuralNetwork`，`CompactRegressionNeuralNetwork`
回归树	`RegressionTree`，`CompactRegressionTree`
金宝app支持向量机回归	`RegressionSVM`，`CompactRegressionSVM`

分类模型对象

金宝app支持模型	完整或紧凑的分类模型对象
用于多类分类的二叉决策树	`ClassificationTree`，`CompactClassificationTree`
判别分析分类器	`ClassificationDiscriminant`，`CompactClassificationDiscriminant`
学习者集合进行分类	`ClassificationEnsemble`，`CompactClassificationEnsemble`，`ClassificationBaggedEnsemble`
基于随机特征展开的高斯核分类模型	`ClassificationKernel`
广义加性模型	`ClassificationGAM`，`CompactClassificationGAM`
k-最近邻模型	`ClassificationKNN`
线性分类模型	`ClassificationLinear`
支持向量机或其他分类器的多类模型金宝app	`ClassificationECOC`，`CompactClassificationECOC`
朴素贝叶斯模型	`ClassificationNaiveBayes`，`CompactClassificationNaiveBayes`
神经网络分类器	`ClassificationNeuralNetwork`，`CompactClassificationNeuralNetwork`
金宝app二值分类的支持向量机	`ClassificationSVM`，`CompactClassificationSVM`

函数句柄——您可以指定一个函数句柄，该函数句柄接受预测器数据并返回一个列向量，其中包含预测器数据中的每个观察结果的预测。预测是用于回归的预测响应或用于分类的分类标签。你必须提供预测数据使用X或customSyntheticData并指定“类型”名称-值参数。

`X`- - - - - -预测数据
数字矩阵|表格

预测数据，指定为数值矩阵或表格。每一行X对应一个观察结果，每一列对应一个变量。

X必须与训练的预测数据一致黑箱，储存于黑箱。X．指定的值不能包含响应变量。

X必须具有与预测器变量相同的数据类型(例如，trainX受过训练的黑箱．组成列的变量X一定要和里面一样的号码和顺序吗trainX．
- 如果你训练黑箱那么，使用一个数字矩阵X一定是一个数字矩阵。
- 如果你训练黑箱那就用桌子吧X一定是一张桌子。的所有预测变量X必须具有与中相同的变量名和数据类型trainX．
石灰不支持稀疏矩阵。金宝app

如果黑箱是否必须提供不包含预测器数据或函数句柄的模型对象X或customSyntheticData．如果黑箱是一个完整的机器学习模型对象，你指定了这个参数，那么石灰不使用预测数据黑箱．它只使用指定的预测器数据。

数据类型:单|双|表格

`customSyntheticData`- - - - - -预生成，自定义合成预测器数据集
`［］`(默认)|数字矩阵|表格

预生成的自定义合成预测器数据集，指定为数字矩阵或表格。

如果您提供预生成的数据集，那么石灰使用所提供的数据集，而不是生成新的合成预测器数据集。

customSyntheticData必须与训练的预测数据一致黑箱，储存于黑箱。X．指定的值不能包含响应变量。

customSyntheticData必须具有与预测器变量相同的数据类型(例如，trainX受过训练的黑箱．组成列的变量customSyntheticData一定要和里面一样的号码和顺序吗trainX
- 如果你训练黑箱那么，使用一个数字矩阵customSyntheticData一定是一个数字矩阵。
- 如果你训练黑箱那就用桌子吧customSyntheticData一定是一张桌子。的所有预测变量customSyntheticData必须具有与中相同的变量名和数据类型trainX．
石灰不支持稀疏矩阵。金宝app

如果黑箱是否必须提供不包含预测器数据或函数句柄的模型对象X或customSyntheticData．如果黑箱是一个完整的机器学习模型对象，你指定了这个参数，那么石灰不使用预测数据黑箱；它只使用指定的预测器数据。

数据类型:单|双|表格

`queryPoint`- - - - - -查询点
数值的行向量|单列表

查询点。石灰解释预测，指定为数值的行向量或单行表。queryPoint必须具有与?相同的数据类型和列数X，customSyntheticData中的预测数据黑箱．

如果你指定numImportantPredictors而且queryPoint，然后石灰函数在创建时符合一个简单的模型石灰对象。

queryPoint不能包含缺失的值。

例子:: blackbox.X (1)将查询点指定为完整机器学习模型中预测器数据的第一个观察点黑箱．

数据类型:单|双|表格

`numImportantPredictors`- - - - - -在简单模型中使用的重要预测因子的数量
正整数标量值

在简单模型中使用的重要预测器的数量，指定为正整数标量值。

如果“SimpleModelType”是“线性”，则该软件选择指定数量的重要预测因子，并拟合所选预测因子的线性模型。
如果“SimpleModelType”是“树”，则软件指定决策分割(或分支节点)的最大数目作为重要预测数，使拟合的决策树最多使用指定的预测数。

如果你指定numImportantPredictors而且queryPoint，然后石灰函数在创建时符合一个简单的模型石灰对象。

数据类型:单|双

名称-值对实参

指定逗号分隔的可选对名称,值参数。的名字参数名称和价值对应的值。的名字必须出现在引号内。可以以任意顺序指定多个名称和值对参数Name1, Value1,…,的家．

例子:石灰（黑箱，“QueryPoint”问,“NumImportantPredictors”n“SimpleModelType”,“树”)指定查询点为问，用于简单模型的重要预测因子的数量为n，并将简单模型的类型作为决策树模型。石灰生成合成预测器数据集的样本，计算样本的预测，并为查询点拟合决策树模型，最多使用指定数量的预测器。

合成预测数据的选项

全部展开

`DataLocality`- - - - - -用于数据生成的合成数据的位置
`“全球”`(默认)|`“本地”`

用于数据生成的合成数据的局域性，指定为逗号分隔的对，由“DataLocality”而且“全球”或“本地”．

“全球”-该软件使用整个预测数据集(X或者预测数据黑箱)．该软件利用估计的参数生成综合预测数据集，并利用该数据集对任意查询点进行简单的模型拟合。
“本地”—软件使用k-查询点的最近邻居，其中k是“NumNeighbors”价值。该软件在每次符合指定查询点的简单模型时生成一个新的合成预测数据集。

有关更多细节，请参见石灰．

例子:“DataLocality”,“当地”

数据类型:字符|字符串

`NumNeighbors`- - - - - -查询点的邻居数
1500(默认)|正整数标量值

查询点的邻居数，指定为逗号分隔的对，由“NumNeighbors”和一个正整数标量值。这个论点只有在“DataLocality”是“本地”．

如果您指定的值大于预测数据集中的观察数(X或者预测数据黑箱),然后石灰使用所有的观察结果。

例子:“NumNeighbors”,2000年

数据类型:单|双

`NumSyntheticData`- - - - - -为合成数据集生成的样本数
5000(默认)|正整数标量值

为合成数据集生成的样本数，指定为逗号分隔的对，由“NumSyntheticData”和一个正整数标量值。

例子:“NumSyntheticData”,2500年

数据类型:单|双

简单型号的选项

全部展开

`KernelWidth`- - - - - -内核宽度
０．７５(默认)|数值标量值

平方指数(或高斯)核函数的核宽，指定为逗号分隔的对，由“KernelWidth”和一个数值标量值。

的石灰函数计算查询点与合成预测数据集中样本之间的距离，然后利用平方指数核函数将这些距离转换为权重。如果你降低“KernelWidth”值,然后石灰使用更关注查询点附近的样本的权重。详情请参见石灰．

例子:“KernelWidth”,0.5

数据类型:单|双

`SimpleModelType`- - - - - -简单模型类型
`“线性”`(默认)|`“树”`

类型，指定为逗号分隔的对，由“SimpleModelType”而且“线性”或“树”．

“线性”-软件拟合线性模型fitrlinear对于回归或fitclinear的分类。
“树”软件拟合决策树模型fitrtree对于回归或fitctree的分类。

例子:“SimpleModelType”、“树”

数据类型:字符|字符串

机器学习模型选项

全部展开

`CategoricalPredictors`- - - - - -分类预测器列表
正整数向量|逻辑向量|字符矩阵|字符串数组|字符向量的单元格数组|`“所有”`

类别预测器列表，指定为逗号分隔的对，由“CategoricalPredictors”和这个表中的一个值。

价值	描述
正整数向量	向量中的每个条目都是一个索引值，指示对应的预测器是分类的。索引值在1和之间`p`,在那里`p`用于训练模型的预测器的数量。如果`黑箱`使用输入变量的一个子集作为预测器，然后软件只使用这个子集对预测器进行索引。的`“CategoricalPredictors”`值不计算响应变量、观察权重变量或函数没有使用的任何其他变量。
逻辑向量	一个`真正的`入口意味着对应的预测因子是绝对的。向量的长度是`p`．
字符矩阵	矩阵的每一行都是一个预测变量的名称。名称必须以表的形式与预测器数据的变量名称相匹配。用额外的空格填充名字，这样字符矩阵的每一行都有相同的长度。
字符向量的字符串数组或单元格数组	数组中的每个元素都是一个预测变量的名称。名称必须以表的形式与预测器数据的变量名称相匹配。
`“所有”`	所有的预测都是绝对的。

如果你指定黑箱那么，作为函数句柄石灰从预测器数据中标识分类预测器X或customSyntheticData．如果预测数据在表格中，石灰如果变量是逻辑向量、无序分类向量、字符数组、字符串数组或字符向量的单元格数组，则假定该变量是分类的。如果预测数据是一个矩阵，石灰假设所有的预测器都是连续的。
如果你指定黑箱作为回归或分类模型对象，那么石灰类标识类别预测器CategoricalPredictors属性。

石灰不支持有序分类预测金宝app器。

例子:“CategoricalPredictors”、“所有”

数据类型:单|双|逻辑|字符|字符串|细胞

`类型`- - - - - -机器学习模型的类型
`的回归`|`“分类”`

机器学习模型的类型，指定为逗号分隔的对，由“类型”而且的回归或“分类”．

在指定时必须指定此参数黑箱作为函数句柄。如果你指定黑箱作为回归或分类模型对象，那么石灰决定了“类型”值，这取决于模型类型。

例子:“类型”、“分类”

数据类型:字符|字符串

计算距离选项

全部展开

`距离`- - - - - -距离度量
特征向量|字符串标量|函数处理

距离度量，指定为逗号分隔的对，由“距离”和字符向量、字符串标量或函数句柄。

如果预测数据只包括连续变量，则石灰金宝app支持这些距离度量。

价值	描述
`“欧几里得”`	欧氏距离。
`“seuclidean”`	标准化欧氏距离。观测值之间的每一个坐标差都通过除以相应的标准差元素来缩放，`S = std(PD，'omitnan')`,在那里`PD`是预测数据还是合成预测数据。要指定不同的缩放，请使用`“规模”`名称-值参数。
`“mahalanobis”`	的样本协方差的马氏距离`PD`，`C = cov(PD，'omitrows')`．要更改协方差矩阵的值，请使用`“浸”`名称-值参数。
`“cityblock”`	城市街区距离。
`闵可夫斯基的`	闵可夫斯基距离。缺省指数为2。要指定不同的指数，请使用`“P”`名称-值参数。
`“chebychev”`	切比乔夫距离(最大坐标差)。
`的余弦`	1减去点间夹角的余弦(作为向量处理)。
`“相关”`	1减去点之间的样本相关性(作为值序列处理)。
`“枪兵”`	1减去观察值之间的样本斯皮尔曼秩相关(作为值序列处理)。
`@distfun`	自定义距离函数手柄。距离函数有这样的形式函数D2 = distfun(ZI,ZJ)距离百分比计算.．. 在哪里 `子`是一个`1`——- - - - - -`t`包含单个观测值的向量。 `ZJ`是一个`年代`——- - - - - -`t`包含多个观察结果的矩阵。`distfun`必须接受一个矩阵`ZJ`用任意数量的观察。 `D2`是一个`年代`——- - - - - -`1`距离向量，和`D2 (k)`观察之间的距离是多少`子`而且`ZJ (k,:)`．如果您的数据不是稀疏的，您通常可以通过使用内置的距离度量而不是函数句柄来更快地计算距离。

如果预测数据包括连续变量和分类变量，那么石灰金宝app支持这些距离度量。

价值	描述
`“goodall3”`	修正Goodall距离
`海底钻井的`	发生频率距离

有关定义，请参见距离度量．

默认值为“欧几里得”如果预测器数据只包括连续变量，或“goodall3”如果预测数据包括连续变量和分类变量。

例子:“距离”、“海底钻井的

数据类型:字符|字符串|function_handle

`浸`- - - - - -马氏距离度量的协方差矩阵
正定矩阵

马氏距离度量的协方差矩阵，指定为逗号分隔的对，由“浸”和一个K——- - - - - -K正定矩阵，其中K是预测器的数量。

这个论点只有在“距离”是“mahalanobis”．

默认的“浸”值是浸(PD omitrows),在那里PD是预测数据还是合成预测数据。如果不指定“浸”值，则软件在计算预测数据和合成预测数据的距离时使用不同的协方差矩阵。

例子:“浸”,眼睛(3)

数据类型:单|双

`P`- - - - - -闵可夫斯基距离度量的指数
`2`(默认)|积极的标量

闵可夫斯基距离度量的指数，指定为逗号分隔的对，由“P”一个正的标量。

这个论点只有在“距离”是闵可夫斯基的．

例子:“P”3

数据类型:单|双

`规模`- - - - - -标准化欧氏距离度量的尺度参数值
非负数值向量

标度参数值的标准化欧氏距离度量，指定为逗号分隔的对，由“规模”和长度的非负数值向量K,在那里K是预测器的数量。

这个论点只有在“距离”是“seuclidean”．

默认的“规模”值是性病(PD omitnan),在那里PD是预测数据还是合成预测数据。如果不指定“规模”值，则软件在计算预测数据和合成预测数据的距离时使用不同的尺度参数。

例子:'Scale'，分位数(X,0.75) -分位数(X,0.25)

数据类型:单|双

属性

全部展开

指定的属性

对象时，可以指定以下属性石灰对象。

`BlackboxModel`- - - - - -有待解释的机器学习模型
回归模型对象|分类模型对象|函数处理

此属性是只读的。

要解释的机器学习模型，指定为回归或分类模型对象或函数句柄。

的黑箱参数设置此属性。

`CategoricalPredictors`- - - - - -分类预测指标
正整数向量|`［］`

此属性是只读的。

分类预测指标，指定为正整数的向量。CategoricalPredictors包含指示相应的预测器是分类的索引值。索引值在1和之间p,在那里p用于训练模型的预测器的数量。如果没有一个预测器是绝对的，则此属性为空(［］)．

如果你指定黑箱然后使用函数句柄石灰从预测器数据中标识分类预测器X或customSyntheticData．如果指定“CategoricalPredictors”参数，则参数设置此属性。
如果你指定黑箱作为回归或分类模型对象，那么石灰方法确定此属性CategoricalPredictors属性。

石灰不支持有序分类预测金宝app器。

如果“SimpleModelType”是“线性”(默认)石灰为每个识别的分类预测器创建虚拟变量。石灰将指定查询点的类别视为引用组，并创建比类别数目少一个虚拟变量。有关更多细节，请参见带参考组的虚拟变量．

数据类型:单|双

`DataLocality`- - - - - -用于数据生成的合成数据的位置
`“全球”`|`“本地”`

此属性是只读的。

用于数据生成的合成数据的位置，指定为“全球”或“本地”．

的“DataLocality”名称-值参数设置此属性。

`NumImportantPredictors`- - - - - -在简单模型中使用的重要预测因子的数量
正整数标量值

此属性是只读的。

在简单模型中使用的重要预测因子数目(SimpleModel)，指定为正整数标量值。

的numImportantPredictors的观点石灰或者是numImportantPredictors的观点适合设置此属性。

数据类型:单|双

`NumSyntheticData`- - - - - -合成数据集中的样本数
正整数标量值

此属性是只读的。

合成数据集中的样本数，指定为正整数标量值。

如果你指定customSyntheticData，则自定义合成数据集中的样本数量设置此属性。
否则,“NumSyntheticData”的名值参数石灰或者是“NumSyntheticData”的名值参数适合设置此属性。

数据类型:单|双

`QueryPoint`- - - - - -查询点
数值的行向量|单列表

此属性是只读的。

查询点。石灰使用简单模型(SimpleModel)，指定为数值的行向量或单行表。

的queryPoint的观点石灰或者是queryPoint的观点适合设置此属性。

数据类型:单|双|表格

`类型`- - - - - -机器学习模型的类型
`的回归`|`“分类”`

此属性是只读的。

机器学习模型的类型(BlackboxModel)，指定为的回归或“分类”．

如果你指定黑箱作为回归或分类模型对象，那么石灰根据模型类型确定此属性。
如果你指定黑箱使用函数句柄，然后“类型”名称-值参数设置此属性。

`X`- - - - - -预测数据
数字矩阵|表格

此属性是只读的。

预测数据，指定为数值矩阵或表格。

每一行X对应一个观察结果，每一列对应一个变量。

如果指定X参数，然后参数设置这个属性。
如果指定customSyntheticData参数，则此属性为空。
如果你指定黑箱作为一个完整的机器学习模型对象而不指定X或customSyntheticData，则此属性值为用于训练的预测器数据黑箱．

石灰不使用包含缺失值的行，也不将行存储在其中X．

数据类型:单|双|表格

计算属性

该软件计算以下属性。

`BlackboxFitted`- - - - - -机器学习模型计算查询点的预测
标量

此属性是只读的。

由机器学习模型计算的查询点预测(BlackboxModel)，指定为一个标量。预测是用于回归的预测响应或用于分类的分类标签。

数据类型:单|双|分类|逻辑|字符|字符串|细胞

`安装`- - - - - -用机器学习模型计算的合成预测器数据的预测
向量

此属性是只读的。

由机器学习模型计算的合成预测器数据的预测(BlackboxModel)，指定为一个向量。

数据类型:单|双|分类|逻辑|字符|字符串|细胞

`ImportantPredictors`- - - - - -重要预测指标
正整数向量

此属性是只读的。

重要的预测指标，指定为正整数的向量。ImportantPredictors包含与简单模型中使用的预测器的列对应的索引值(SimpleModel)．

数据类型:单|双

`SimpleModel`- - - - - -简单的模型
`RegressionLinear`模型对象|`RegressionTree`模型对象|`ClassificationLinear`模型对象|`ClassificationTree`模型对象

此属性是只读的。

简单型号，指定为RegressionLinear，RegressionTree，ClassificationLinear,或ClassificationTree模型对象。石灰根据机器学习模型的类型确定简单模型对象的类型(类型)和简单模型的类型(“SimpleModelType”)．

`SimpleModelFitted`- - - - - -用简单模型计算查询点的预测
标量

此属性是只读的。

对简单模型计算的查询点的预测(SimpleModel)，指定为一个标量。

如果SimpleModel是ClassificationLinear，然后SimpleModelFitted取值为1 ~ -1。

的SimpleModelFitted当简单模型的预测与时，值为1BlackboxFitted(来自机器学习模型的预测)。
的SimpleModelFitted值为-1，如果从简单模型的预测与BlackboxFitted．如果BlackboxFitted值是一个，然后情节函数显示SimpleModelFitted值作为不是一个．

数据类型:单|双|分类|逻辑|字符|字符串|细胞

`SyntheticData`- - - - - -综合预测数据
数字矩阵|表格

此属性是只读的。

综合预测数据，指定为数字矩阵或表格。

如果指定customSyntheticData输入参数，然后参数设置此属性。
否则,石灰从预测器数据估计分布参数X并生成一个综合预测数据集。

数据类型:单|双|表格

对象的功能

`适合`	拟合局部可解释模型不可知论解释(LIME)的简单模型
`情节`	局部可解释模型不可知论解释(LIME)的绘图结果

例子

全部折叠

用决策树简单模型解释预测

打开实时脚本

训练一个分类模型并创建一个石灰对象，该对象使用决策树简单模型。当您创建石灰对象，指定一个查询点和重要预测器的数量，以便软件生成合成数据集的样本，并为查询点拟合一个具有重要预测器的简单模型。然后利用目标函数在简单模型中显示估计的预测因子重要性情节．

加载CreditRating_Historical数据集。数据集包含客户id及其财务比率、行业标签和信用评级。

TBL =可读的(“CreditRating_Historical.dat”）;

显示表的前三行。

头(资源描述,3)

ans =3×8表ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级  _____ _____ _____ _______ ________ _____ ________ ______ 62394 0.013 0.104 0.036 0.447 0.142 3{“BB”}48608 0.232 0.335 0.062 1.969 0.281 8 {A} 42444 0.311 0.367 0.074 1.935 0.366 1 {A}

通过删除客户id和评级列，创建一个预测器变量表资源描述．

tblX = removevars(tbl，[“ID”，“评级”]);

训练一个信用评级的黑盒模型fitcecoc函数。

blackbox = fitcecoc(tblX,tbl。评级,“CategoricalPredictors”，“行业”）;

创建一个石灰对象，该对象使用决策树简单模型解释对最后一次观察结果的预测。指定“NumImportantPredictors”找出最多6个重要的预测因子。如果指定“QueryPoint”而且“NumImportantPredictors”类时的值石灰对象，然后软件生成合成数据集的样本，并为合成数据集拟合一个简单的可解释模型。

queryPoint = tblX(end，:)

queryPoint =1×6表WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业  _____ _____ _______ ________ ____ ________ 0.239 0.463 0.065 2.924 0.34 - 2

rng (“默认”）%用于重现性结果=石灰(黑盒子，“QueryPoint”queryPoint,“NumImportantPredictors”6.．.“SimpleModelType”，“树”）

results = lime with properties: BlackboxModel: [1x1 ClassificationECOC] DataLocality: 'global' CategoricalPredictors: 6 Type: 'classification' X: [3932x6 table] QueryPoint: [1x6 table] NumImportantPredictors: 6 NumSyntheticData: 5000 SyntheticData: [5000x1 cell} SimpleModel: [1x1 ClassificationTree] ImportantPredictors: [2x1 double] blackboxsuits: {'AA'} simplemodelsuits: {'AA'}

画出石灰对象结果通过使用object函数情节．若要在任何预测器名称中显示现有下划线，请更改TickLabelInterpreter坐标轴的值“没有”．

F =图(结果);f.CurrentAxes.TickLabelInterpreter =“没有”；

图中包含一个axes对象。标题为LIME和Decision Tree Model的axis对象包含一个类型为bar的对象。

图中显示了查询点的两个预测，它们对应于BlackboxFitted财产和SimpleModelFitted的属性结果．

水平柱状图显示了排序后的预测器重要性值。石灰查找财务比率变量EBIT_TA而且WC_TA作为查询点的重要预测器。

您可以通过使用数据提示或栏属性．例如，你可以找到酒吧对象。findobj函数，并将标签添加到条的末端文本函数。

B = findobj(f，“类型”，“酒吧”）;文本(b.YEndPoints + 0.001, b.XEndPoints字符串(b.YData))

图中包含一个axes对象。标题为LIME with Decision Tree Model的坐标轴对象包含类型为bar、text的3个对象。

或者，您可以在带有预测器变量名的表中显示系数值。

imp = b.YData;flipud (array2table(小鬼”,.．.“RowNames”f.CurrentAxes.YTickLabel,“VariableNames”, {“预测的重要性”}))

ans =2×1表预测的重要性  ____________________ MVE_BVTD 0.088412 RE_TA 0.0018061

用线性简单模型解释预测

打开实时脚本

训练一个回归模型并创建一个石灰对象，该对象使用线性简单模型。当您创建石灰对象，如果不指定查询点和重要预测器的数量，则软件生成合成数据集的样本，但不适合简单的模型。使用object函数适合为查询点拟合一个简单模型。然后利用目标函数显示拟合线性简单模型的系数情节．

加载carbig数据集，包含70年代和80年代早期生产的汽车的测量数据。

负载carbig

创建一个包含预测变量的表加速度，气缸，等等，以及响应变量英里/加仑．

tbl =表(加速度，气缸，排量，马力，型号，年份，重量，MPG);

删除训练集中的缺失值可以帮助减少内存消耗并加速训练fitrkernel函数。中删除缺失的值资源描述．

TBL = rmmissing(TBL);

通过删除响应变量，创建一个预测变量表资源描述．

tblX = removevars(tbl，“英里”）;

训练一个黑箱模型英里/加仑通过使用fitrkernel函数。

rng (“默认”）%用于重现性mdl = fitrkernel(tblX,tbl。英里/加仑,“CategoricalPredictors”[2 - 5]);

创建一个石灰对象。指定一个预测数据集，因为mdl不包含预测器数据。

results = lime(mdl,tblX)

results = lime with properties: BlackboxModel: [1x1 RegressionKernel] DataLocality: 'global' CategoricalPredictors: [2 5] Type: 'regression' X: [392x6 table] QueryPoint: [] NumImportantPredictors: [] NumSyntheticData: 5000 synticdata: [5000x6 table] suitable: [5000x1 double] SimpleModel: [] ImportantPredictors: [] blackboxsuitable: [] simplemodelpredictors: []

结果包含生成的合成数据集。的SimpleModel物业为空(［］)．

中第一次观测拟合线性简单模型tblX．指定要查找的重要预测器的数量为3。

queryPoint = tblX(1，:)

queryPoint =1×6表加速气缸位移马力Model_Year重量  ____________ _________ ____________ __________ __________ ______ 12 8 307 130 70 3504

results = fit(results,queryPoint,3);

画出石灰对象结果通过使用object函数情节．若要在任何预测器名称中显示现有下划线，请更改TickLabelInterpreter坐标轴的值“没有”．

F =图(结果);f.CurrentAxes.TickLabelInterpreter =“没有”；

图中包含一个axes对象。标题为LIME with Linear Model的axis对象包含一个类型为bar的对象。

图中显示了查询点的两个预测，它们对应于BlackboxFitted财产和SimpleModelFitted的属性结果．

水平柱状图显示了简单模型的系数值，按它们的绝对值排序。石灰发现马力，Model_Year,气缸作为查询点的重要预测器。

Model_Year而且气缸是具有多个类别的类别预测器。对于线性简单模型，软件为每个类别预测器创建的虚拟变量比类别数量少一个。柱状图只显示最重要的虚拟变量。方法可以检查其他虚拟变量的系数SimpleModel的属性结果．显示已排序的系数值，包括所有类别虚拟变量。

[~，I] = sort(abs(results. simplmodel . beta)，“下”）;表(results.SimpleModel.ExpandedPredictorNames (I)”,results.SimpleModel.Beta(我),.．.“VariableNames”, {“扩展预测名称”，“系数”})

ans =17×2表Exteded预测名字系数  __________________________ ___________ {' -3.4485马力的}e-05 {Model_Year(74和70)的}-6.1279 e-07{“Model_Year(80和70)的}-4.015 e-07{“Model_Year(81和70)的}3.4176 e-07{“Model_Year(82和70)的}-2.2483 e-07{的圆柱体(6和8)}-1.9024 e-07{“Model_Year(76和70)的}1.8136 e-07{的圆柱体(5和8)}1.7461 e-07{“Model_Year(71和70)的}1.558 e-07{“Model_Year(75和70)的}1.5456 e-07{“Model_Year(77和70)的}1.521 e-07 {Model_Year (78 vs。70)'} 1.4272e-07 {'Model_Year (72 vs. 70)'} 6.7001e-08 {'Model_Year (73 vs. 70)'} 4.7214e-08{'气缸(4 vs. 8)'} 4.5118e-08 {'Model_Year (79 vs. 70)'} -2.2598e-08

指定黑箱模型为函数句柄

打开实时脚本

训练一个回归模型并创建一个石灰对象的函数句柄预测模型的功能。使用object函数适合为指定的查询点拟合一个简单模型。然后利用目标函数显示拟合线性简单模型的系数情节．

加载carbig数据集，包含70年代和80年代早期生产的汽车的测量数据。

负载carbig

创建一个包含预测变量的表加速度，气缸，等等。

tbl =表(加速度，气缸，排量，马力，型号，年份，重量);

训练一个黑箱模型英里/加仑通过使用TreeBagger函数。

rng (“默认”）%用于重现性Mdl = TreeBagger(100,tbl,MPG，“方法”，“回归”，“CategoricalPredictors”[2 - 5]);

石灰不支持金宝appTreeBagger的第一个输入参数(黑箱模型)石灰作为一个TreeBagger对象。方法的函数句柄预测函数。的选项预测使用函数的名称-值参数的函数。

类的函数句柄预测的功能TreeBagger对象Mdl．指定要用作的树索引数组1:50．

myPredict = @(tbl) predict(Mdl,tbl，“树”、1:50);

创建一个石灰对象使用函数句柄myPredict．当将黑箱模型指定为函数句柄时，必须提供预测器数据并指定“类型”名称-值参数。资源描述包括直言预测符(油缸而且Model_Year)与双数据类型。默认情况下,石灰不使用双数据类型作为类别预测器。指定第二个(油缸)和第五(Model_Year)变量作为范畴预测器。

结果= lime(myPredict,tbl，“类型”，“回归”，“CategoricalPredictors”[2 - 5]);

中第一次观测拟合线性简单模型资源描述．若要在任何预测器名称中显示现有下划线，请更改TickLabelInterpreter坐标轴的值“没有”．

Results = fit(Results,tbl(1，:)，4);F =图(结果);f.CurrentAxes.TickLabelInterpreter =“没有”；

图中包含一个axes对象。标题为LIME with Linear Model的axis对象包含一个类型为bar的对象。

石灰发现马力，位移，气缸,Model_Year作为重要的预测指标。

算法

全部展开

石灰

用LIME解释机器学习模型的预测[1]，该软件生成合成数据集，并对合成数据集拟合一个简单的可解释模型石灰而且适合，如步骤1-5所述。

如果指定queryPoint而且numImportantPredictors的值石灰，然后石灰函数执行所有步骤。
如果不指定queryPoint而且numImportantPredictors并指定“DataLocality”作为“全球”(默认)，然后石灰函数生成合成数据集(步骤1-2)，而适合函数适合一个简单的模型(步骤3-5)。
如果不指定queryPoint而且numImportantPredictors并指定“DataLocality”作为“本地”，然后适合函数执行所有步骤。

的石灰而且适合函数执行以下步骤:

生成一个合成预测数据集X_年代对连续变量采用多元正态分布，对每个类别变量采用多项分布。方法可以指定要生成的样例的数量“NumSyntheticData”名称-值参数。
- 如果“DataLocality”是“全球”(默认值)，然后软件从整个预测数据集(X或预测数据黑箱)．
- 如果“DataLocality”是“本地”的分布参数进行估计k-查询点的最近邻居，其中k是“NumNeighbors”价值。方法可以指定一个距离度量来查找最近的邻居“距离”名称-值参数。
该软件在估计分布参数时忽略预测器数据集中的缺失值。
方法提供预生成的自定义合成预测器数据集customSyntheticData的输入参数石灰．
计算预测Y_年代对于合成数据集X_年代．预测是用于回归的预测响应或用于分类的分类标签。该软件使用预测的功能黑箱模型来计算预测。如果你指定黑箱作为函数句柄，然后软件使用函数句柄计算预测。
计算距离d在查询点和合成预测器数据集中的样本之间使用指定的距离度量“距离”．
计算权重值w_问合成预测器数据集中的样本相对于查询点的问使用平方指数(或高斯)核函数

$w_{问} （ x_{年代} ）＝经验值（ - \frac{1}{2} {（ \frac{d （ x_{年代} ，问）}{\sqrt{p} σ} ）}^{2} ）．$
- x_年代是合成预测数据集中的样本吗X_年代．
- d（x_年代，问）样品之间的距离是多少x_年代以及查询点问．
- p预测因子的数量在吗X_年代．
- σ内核宽度，您可以使用“KernelWidth”名称-值参数。默认的“KernelWidth”值为0.75。
查询点的权重值为1，然后随着距离值的增加，它收敛于零。的“KernelWidth”值控制权重值收敛到零的速度。越低“KernelWidth”值，权重值收敛于零的速度越快。因此，算法赋予查询点附近的样本更多的权重。由于该算法使用了这些权重值，选择的重要预测因子和拟合的简单模型有效地解释了在查询点附近对合成数据的局部预测。
适合一个简单的模型。
- 如果“SimpleModelType”是“线性”(默认)，然后软件选择重要的预测因子，并拟合所选重要预测因子的线性模型。
  - 选择n重要预测指标( ${\tilde{X}}_{年代}$ )，采用群正交匹配追踪(OMP)算法[２][3],在那里n是numImportantPredictors价值。该算法使用合成预测数据集(X_年代)、预测(Y_年代)和权重值(w_问)．
  - 拟合所选重要预测因子的线性模型( ${\tilde{X}}_{年代}$ )到预测(Y_年代)使用权值(w_问)．软件的用途fitrlinear对于回归或fitclinear的分类。对于一个多类模型，该软件使用一个对所有的方案来构造一个二元分类问题。的查询点的预测类黑箱模型中，负类指的是其他类。
- 如果“SimpleModelType”是“树”，则软件拟合决策树模型fitrtree对于回归或fitctree的分类。该软件指定决策分割(或分支节点)的最大数量作为重要预测器的数量，以便拟合的决策树最多使用指定的预测器数量。

参考文献

Ribeiro, Marco Tulio, S. Singh, C. Guestrin。“‘我为什么要相信你?“解释任何分类器的预测。”第22届ACM SIGKDD知识发现与数据挖掘国际会议论文集, 1135 - 44。旧金山，加利福尼亚州:ACM, 2016。

[2] Świrszcz, Grzegorz, Abe直树，Aurélie C. Lozano。变量选择与预测的分组正交匹配追踪。神经信息处理系统的研究进展(2009): 1150 - 58。

[3]洛扎诺，Aurélie C, Grzegorz Świrszcz，阿部直树。逻辑回归的群正交匹配追踪。第十四届人工智能与统计国际会议论文集(2011): 452 - 60。

另请参阅

plotPartialDependence|沙普利

主题

用LIME解释表格数据上的深度网络预测(深度学习工具箱)
解释机器学习模型

在R2020b中引入

石灰

描述

创建

语法

描述

输入参数

黑箱- - - - - -有待解释的机器学习模型回归模型对象|分类模型对象|函数处理

X- - - - - -预测数据数字矩阵|表格

customSyntheticData- - - - - -预生成，自定义合成预测器数据集［］(默认)|数字矩阵|表格

queryPoint- - - - - -查询点数值的行向量|单列表

numImportantPredictors- - - - - -在简单模型中使用的重要预测因子的数量正整数标量值

DataLocality- - - - - -用于数据生成的合成数据的位置“全球”(默认)|“本地”

NumNeighbors- - - - - -查询点的邻居数1500(默认)|正整数标量值

NumSyntheticData- - - - - -为合成数据集生成的样本数5000(默认)|正整数标量值

KernelWidth- - - - - -内核宽度０．７５(默认)|数值标量值

SimpleModelType- - - - - -简单模型类型“线性”(默认)|“树”

CategoricalPredictors- - - - - -分类预测器列表正整数向量|逻辑向量|字符矩阵|字符串数组|字符向量的单元格数组|“所有”

类型- - - - - -机器学习模型的类型的回归|“分类”

距离- - - - - -距离度量特征向量|字符串标量|函数处理

浸- - - - - -马氏距离度量的协方差矩阵正定矩阵

P- - - - - -闵可夫斯基距离度量的指数2(默认)|积极的标量

规模- - - - - -标准化欧氏距离度量的尺度参数值非负数值向量

属性

指定的属性

BlackboxModel- - - - - -有待解释的机器学习模型回归模型对象|分类模型对象|函数处理

CategoricalPredictors- - - - - -分类预测指标正整数向量|［］

DataLocality- - - - - -用于数据生成的合成数据的位置“全球”|“本地”

NumImportantPredictors- - - - - -在简单模型中使用的重要预测因子的数量正整数标量值

NumSyntheticData- - - - - -合成数据集中的样本数正整数标量值

QueryPoint- - - - - -查询点数值的行向量|单列表

类型- - - - - -机器学习模型的类型的回归|“分类”

X- - - - - -预测数据数字矩阵|表格

计算属性

BlackboxFitted- - - - - -机器学习模型计算查询点的预测标量

安装- - - - - -用机器学习模型计算的合成预测器数据的预测向量

ImportantPredictors- - - - - -重要预测指标正整数向量

SimpleModel- - - - - -简单的模型RegressionLinear模型对象|RegressionTree模型对象|ClassificationLinear模型对象|ClassificationTree模型对象

SimpleModelFitted- - - - - -用简单模型计算查询点的预测标量

SyntheticData- - - - - -综合预测数据数字矩阵|表格

对象的功能

例子

用决策树简单模型解释预测

用线性简单模型解释预测

指定黑箱模型为函数句柄

更多关于

距离度量

算法

石灰

参考文献

另请参阅

主题

统计和机器学习工具箱文档

金宝app

掌握机器学习:MATLAB的一步一步指南

`黑箱`- - - - - -有待解释的机器学习模型
回归模型对象|分类模型对象|函数处理

`X`- - - - - -预测数据
数字矩阵|表格

`customSyntheticData`- - - - - -预生成，自定义合成预测器数据集
`［］`(默认)|数字矩阵|表格

`queryPoint`- - - - - -查询点
数值的行向量|单列表

`numImportantPredictors`- - - - - -在简单模型中使用的重要预测因子的数量
正整数标量值

`DataLocality`- - - - - -用于数据生成的合成数据的位置
`“全球”`(默认)|`“本地”`

`NumNeighbors`- - - - - -查询点的邻居数
1500(默认)|正整数标量值

`NumSyntheticData`- - - - - -为合成数据集生成的样本数
5000(默认)|正整数标量值

`KernelWidth`- - - - - -内核宽度
０．７５(默认)|数值标量值

`SimpleModelType`- - - - - -简单模型类型
`“线性”`(默认)|`“树”`

`CategoricalPredictors`- - - - - -分类预测器列表
正整数向量|逻辑向量|字符矩阵|字符串数组|字符向量的单元格数组|`“所有”`

`类型`- - - - - -机器学习模型的类型
`的回归`|`“分类”`

`距离`- - - - - -距离度量
特征向量|字符串标量|函数处理

`浸`- - - - - -马氏距离度量的协方差矩阵
正定矩阵

`P`- - - - - -闵可夫斯基距离度量的指数
`2`(默认)|积极的标量

`规模`- - - - - -标准化欧氏距离度量的尺度参数值
非负数值向量

`BlackboxModel`- - - - - -有待解释的机器学习模型
回归模型对象|分类模型对象|函数处理

`CategoricalPredictors`- - - - - -分类预测指标
正整数向量|`［］`

`DataLocality`- - - - - -用于数据生成的合成数据的位置
`“全球”`|`“本地”`

`NumImportantPredictors`- - - - - -在简单模型中使用的重要预测因子的数量
正整数标量值

`NumSyntheticData`- - - - - -合成数据集中的样本数
正整数标量值

`QueryPoint`- - - - - -查询点
数值的行向量|单列表

`类型`- - - - - -机器学习模型的类型
`的回归`|`“分类”`

`X`- - - - - -预测数据
数字矩阵|表格

`BlackboxFitted`- - - - - -机器学习模型计算查询点的预测
标量

`安装`- - - - - -用机器学习模型计算的合成预测器数据的预测
向量

`ImportantPredictors`- - - - - -重要预测指标
正整数向量

`SimpleModel`- - - - - -简单的模型
`RegressionLinear`模型对象|`RegressionTree`模型对象|`ClassificationLinear`模型对象|`ClassificationTree`模型对象

`SimpleModelFitted`- - - - - -用简单模型计算查询点的预测
标量

`SyntheticData`- - - - - -综合预测数据
数字矩阵|表格