主要内容

情节

情节夏普利值

自从R2021a

    描述

    例子

    图(讲解员)创建一个水平条形图的夏普利值沙普利对象讲解员。这些值存储在对象的ShapleyValues财产。每一栏显示了黑箱模型中的每个特性的夏普利值(讲解员。BlackboxModel)查询点(讲解员。QueryPoint)。

    例子

    图(讲解员,名称,值)使用一个或多个名称参数指定附加选项。例如,指定“NumImportantPredictors”, 5绘制的夏普利值最高的五个功能绝对夏普利值。

    b =情节(___)返回一个条形图对象b使用任何输入参数组合在前面的语法。使用b查询或修改栏属性创建后的条形图。

    例子

    全部折叠

    训练一个分类模型,并创建一个沙普利对象。然后情节夏普利值通过使用对象的功能情节

    加载CreditRating_Historical数据集,数据集包含客户id和他们的财务比率,行业标签,信用评级。

    台= readtable (“CreditRating_Historical.dat”);

    显示表的前三行。

    头(资源描述,3)
    ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级_____ _____ _____和______ _____ ________ ________ 62394 0.013 0.104 0.036 0.447 0.142 3 {“BB”} 48608 0.232 0.335 0.062 1.969 0.281 8 {A} 42444 0.311 0.367 0.074 1.935 0.366 1 {A}

    火车的黑箱模型使用的信用评级fitcecoc函数。使用变量通过第七列第二资源描述作为预测变量。推荐的做法是指定类名设置类的顺序。

    黑箱= fitcecoc(资源描述,“评级”,“PredictorNames”tbl.Properties.VariableNames (7),“CategoricalPredictors”,“行业”,“类名”,{“AAA”“AA”“一个”“BBB”“BB”“B”“CCC”});

    创建一个沙普利对象,阐述了预测最后的观察。为更快的计算,子样品的观察的25%资源描述与分层和使用样本来计算夏普利值。

    queryPoint =(资源(最终,:)
    queryPoint =表1×8ID WC_TA RE_TA EBIT_TA MVE_BVTD S_TA行业评级_____ _____ _____ _________ __ ________ ________ ________ 73104 0.239 0.463 0.065 2.924 0.34 - 2 {“AA”}
    rng (“默认”)%的再现性c = cvpartition (tbl.Rating“坚持”,0.25);:tbl_ =台(测试(c):);:tbl_讲解员=沙普利(黑盒,“QueryPoint”,queryPoint);

    对于一个分类模型,沙普利计算夏普利值使用预测类分数为每个类。显示的值ShapleyValues财产。

    explainer.ShapleyValues
    ans =6×8表预测AAA AA BBB BB B CCC __________ _____ __________ ___________ __________ ___________ __________ __________“WC_TA”0.051045 0.022644 0.0096138 0.0015954 -0.027857 -0.04134 -0.039476“RE_TA”0.16729 0.09479 0.05308 -0.011178 -0.087689 -0.20847 -0.29204“EBIT_TA”0.0012015 0.00053338 0.00043344 0.00012321 -0.00066994 -0.0013388 -0.0011793“MVE_BVTD”1.3377 1.338 0.67839 -0.027654 -0.55142 -0.75327 -0.59578“S_TA”-0.012484 -0.009098 -0.00074119 -0.0035582 - -7.3462 0.0014495 - -0.0020609 e-05“行业”-0.099117 -0.046867 0.0031376 0.080071 0.089726 0.099699 0.15691

    ShapleyValues属性包含所有功能的夏普利值为每个类。

    情节的夏普利值预测类使用情节函数。

    情节(讲解员)

    图包含一个坐标轴对象。坐标轴对象与标题沙普利解释,包含夏普利值,ylabel预测包含一个对象类型的酒吧。

    水平条形图显示了所有变量的夏普利值,按他们的绝对值。每个夏普利值解释查询的得分点的偏差的平均分数预测类,由于相应的变量。

    情节的夏普利值通过指定的所有类的所有类名explainer.BlackboxModel

    情节(讲解员,“类名”explainer.BlackboxModel.ClassNames)

    图包含一个坐标轴对象。坐标轴对象与标题沙普利解释,包含夏普利值,ylabel预测包含7对象类型的酒吧。这些对象代表AAA、AA, A, BBB, BB, B, CCC。

    训练一个回归模型,并创建一个沙普利对象。使用目标函数适合指定的查询计算夏普利值点。然后情节的夏普利值预测函数通过使用对象情节。指定数量的情节当你调用的重要预测因子情节函数。

    加载carbig的数据集,其中包含测量汽车在1970年代末和1980年代初。

    负载carbig

    创建一个表包含预测变量加速度,气缸等等,以及响应变量英里/加仑

    台=表(加速度、汽缸、排量、马力、Model_Year重量,MPG);

    删除缺失值在一个训练集可以帮助减少内存消耗,加速训练fitrkernel函数。删除缺失值资源描述

    台= rmmissing(台);

    火车的黑箱模型英里/加仑通过使用fitrkernel函数

    rng (“默认”)%的再现性mdl = fitrkernel(资源描述,“英里”,“CategoricalPredictors”[2 - 5]);

    创建一个沙普利对象。指定的数据集资源描述,因为mdl不包含训练数据。

    讲解员=沙普利(mdl(资源)
    讲解员=沙普利与属性:BlackboxModel: [1 x1 RegressionKernel] QueryPoint: [] BlackboxFitted: [] ShapleyValues: [] NumSubsets: 64 X: [392 x7表]CategoricalPredictors:[2 5]方法:“interventional-kernel”拦截:22.6202

    讲解员存储训练数据资源描述X财产。

    计算所有预测变量的夏普利值第一观察资源描述

    :queryPoint =(资源(1)
    queryPoint =表1×7加速汽缸位移马力Model_Year重量MPG _______ _____ _______ __________ __________ ______ ___ 12 8 307 130 70 3504
    讲解员=适合(讲解员,queryPoint);

    回归模型,沙普利使用预测响应计算夏普利值,并将它们存储在ShapleyValues财产。显示的值ShapleyValues财产。

    explainer.ShapleyValues
    ans =6×2表预测_______ ShapleyValue * * *“加速度”-0.1561“气缸”-0.18306“位移”-0.34203“马力”-0.27291“Model_Year”-0.2926“重量”-0.32402

    情节的夏普利值查询使用情节函数。指定“NumImportantPredictors”, 5只图的五个最重要的预测因子预测反应。

    情节(讲解员,“NumImportantPredictors”5)

    图包含一个坐标轴对象。坐标轴对象与标题沙普利解释,包含夏普利值,ylabel预测包含一个对象类型的酒吧。

    水平条形图显示了夏普利值五个最重要的预测因子,按他们的绝对值。每个夏普利值解释查询的预测点的偏差从平均,由于相应的变量。

    输入参数

    全部折叠

    对象解释黑箱模型,指定为一个沙普利对象。

    名称-值参数

    指定可选的双参数作为Name1 = Value1,…,以=家,在那里的名字参数名称和吗价值相应的价值。名称-值参数必须出现在其他参数,但对的顺序无关紧要。

    R2021a之前,用逗号来分隔每一个名称和值,并附上的名字在报价。

    例子:情节(讲解员,NumImportantPredictors 5“类名”,c)创建一个条形图包含的夏普利值五类最重要的预测因子c

    许多重要的预测图,指定为一个正整数。的情节功能块的夏普利值最高的指定数量的预测绝对夏普利值。

    例子:“NumImportantPredictors”, 5指定绘制五个最重要的预测因子。的情节函数确定重要性的顺序使用绝对夏普利值。

    数据类型:|

    类标签图,指定为分类或字符数组,逻辑或数值向量,或单元阵列的特征向量。和数据类型的值“类名”值必须匹配的类名一会机器学习模型的属性讲解员(explainer.BlackboxModel.ClassNames)。

    您可以指定一个或多个标签。如果你指定多个类标签,每个特性的功能块多个酒吧不同的颜色。

    默认值是(查询的预测类点BlackboxFitted的属性讲解员)。

    这个论点是有效的只有当机器学习模型(BlackboxModel)讲解员是一个分类模型。

    例子:“类名”,{“红”、“蓝”}

    例子:“类名”,explainer.BlackboxModel.ClassNames指定“类名”在所有类BlackboxModel

    数据类型:||逻辑|字符|细胞|分类

    更多关于

    全部折叠

    沙普利值

    在博弈论中,一个球员的夏普利值是平均边际贡献的球员合作游戏。上下文中的机器学习预测的夏普利值功能查询点解释特性预测的贡献(响应回归或得分的每个类分类)在指定的查询。

    的夏普利值功能查询点的贡献平均预测偏差特性。查询点,沙普利值之和所有功能对应的总偏差预测的平均水平。也就是说,平均预测和沙普利值的总和为所有特性对应查询的预测点。

    更多细节,请参阅沙普利值机器学习模型

    引用

    [1]Lundberg,斯科特·M。李,美国。“一个统一的方法来解释模型的预测”。先进的神经信息处理系统30 (2017):4765 - 774。

    [2]Aas、Kjersti马丁Jullum,安德斯Løland。“解释个人预测当依赖特性:更精确的近似夏普利值。”人工智能298(2021年9月)。

    [3]Lundberg,斯科特·M。,G. Erion, H. Chen, et al. "From Local Explanations to Global Understanding with Explainable AI for Trees."自然机器智能2(2020年1月):56 - 67。

    版本历史

    介绍了R2021a