主要内容

描述

描述生成特性

    描述

    描述(变压器)打印生成的特征的描述变压器。创建FeatureTransformer对象变压器通过使用gencfeatures函数。

    描述(变压器,指数)打印标识的特性的描述指数

    例子

    信息=描述(___)返回表中的功能描述。行名称信息对应的名称功能。

    例子

    全部折叠

    从一个表生成特性的预测数据通过使用gencfeatures。通过使用检查生成的特性描述对象的功能。

    读取断电数据表到工作区中。删除与失踪的观察值,并显示表的前几行。

    中断= readtable (“outages.csv”);台= rmmissing(中断);头(台)
    ans =8×6表地区OutageTime损失客户RestorationTime引起_________________ ___________ ______ __________ ___________ ___________________{“西南”}2002-02-01 12:18 458.98 - 1.8202 e + 06 2002-02-01 16:50{“暴风雪”}{“东南”}2003-02-07)21:15 289.4 - 1.4294 e + 05 2003-02-07 08:14{“暴风雪”}{‘西方’}2004-04-06 05:44 434.81 - 3.4037 e + 05 2004-04-06 06:10{“设备故障”}{“中西部”}2002-03-16 06:18 186.44 - 2.1275 e + 05 2002-03-16 23:23{“暴风”}{‘西方’}2003-06-18 02:49 0 0 2003-06-18 10:54{‘攻击’}{“东北”}2003-07-16十六23 239.93 49434 2003-07-16 01:12{‘火’}{“中西部”}2004-09-27 11:09 286.72 66104 2004-09-27 16:37{“设备故障”}{“东南”}2004-09-05 17:48 73.387 36073 2004-09-05 20:46{“设备故障”}

    的一些变量,如OutageTimeRestorationTime不支持数据类型,通过分类器训练功能金宝appfitcensemble

    产生25特性的预测资源描述可以用来训练袋装。指定地区表变量作为响应。

    变压器= gencfeatures(资源描述,“地区”25岁的“TargetLearner”,“包”)
    变压器= FeatureTransformer属性:类型:“分类”TargetLearner:“袋子”NumEngineeredFeatures: 22 NumOriginalFeatures: 3 TotalNumFeatures: 25

    变压器对象包含的信息特性和转换生成用于创建它们。

    为了更好地理解生成的特性,使用描述对象的功能。

    信息=描述(变压器)
    信息=25×4表类型IsOriginal数据源转换___________ __________ ___________________________ _________________________________________________________________________________________________________________损失数字真的损失”“客户数字真实客户”“c(原因)直言真正原因”类型的变量分类从一个单元格的数据类型转换”RestorationTime-OutageTime数字虚假OutageTime RestorationTime OutageTime之间时间间隔,以秒为单位和RestorationTime sdn (OutageTime)数字虚假OutageTime“连环日期数量从01 - 2月- 2002 12:18:00”woe3 (c(原因))数字错误原因”类型的变量分类从一个细胞转换数据类型- >重量的证据(积极类=东南)“机灵(OutageTime)数字虚假OutageTime“天”(OutageTime)数字虚假OutageTime“年”kmd1数字错误的损失,客户“欧几里得距离重心1 (kmeans集群与k = 10)“kmd5数字错误的损失,客户“欧几里得距离重心5 (kmeans集群与k = 10)“季度(OutageTime)数字虚假OutageTime“季度”woe2 (c(原因))数字错误原因”类型的变量分类从一个细胞转换数据类型- >重量的证据(积极类=东北)”一年(RestorationTime)数字虚假RestorationTime“年”月(OutageTime)数字虚假OutageTime“月”损失。*客户数字错误的损失,客户“损失。*客户”tod (OutageTime)数字虚假OutageTime⋮“时间的秒”

    信息表说明以下:

    • 前三个生成的原始特性资源描述,虽然软件转换原始导致变量分类变量c(原因)

    • OutageTimeRestorationTime变量是不包括因为它们生成的特性datetime变量,不能用于训练的整体模型。然而,软件生成的许多特性来自这些变量,如四个特点RestorationTime-OutageTime

    • 一些生成特性的组合多个转换。例如,软件生成第六功能woe3 (c(原因)通过转换导致变量分类变量,然后计算重量的证据产生的变量的值。

    输入参数

    全部折叠

    变压器特性,指定为一个FeatureTransformer对象。

    特征描述,指定为一个数字或逻辑向量表示的位置特征,或一个字符串数组或单元阵列特征向量的表示特性的名称。

    例子:1:12

    数据类型:||逻辑|字符串|细胞

    输出参数

    全部折叠

    功能描述,作为一个表返回。每一行对应一个生成的功能,和每列提供了以下信息。

    列名 描述
    类型 显示的数据类型的功能数字分类
    IsOriginal 显示功能是一个原始的特性(是否真正的)或一个工程特性()
    数据源 显示原始功能用于生成功能
    转换 描述了用于生成的转换特性,它们的顺序——申请更多的信息,知道了功能转换

    算法

    全部折叠

    功能转换

    这个表提供了额外的信息的一些更复杂的功能转换的描述Info.Transformations

    样品功能名称 样本转换描述信息 额外的信息
    eb4(变量) Equal-width装箱(箱子的数量= 4) 该软件将变量值到4箱子的宽度相等。由此产生的特性是一个分类变量。
    fenc(变量) 频率编码(水平的数量= 10) 软件计算的频率10类别(或水平)变量。在生成的功能,软件取代与频率对应的类别,每个类别值创建一个数值变量。
    kmc1 重心编码(# 1)组件(kmeans集群与k = 10) 软件使用k——集群分配每个观察之一10集群。产生的特性中的每一行对应一个观察和1圣组件集群的质心与观察。由此产生的特性是一个数值变量。
    kmd4 欧氏距离重心4 (kmeans集群与k = 10) 软件使用k——集群分配每个观察之一10集群。每一行在结果特性是欧几里得距离对应的观测的重心4集群。由此产生的特性是一个数值变量。
    kmi 集群索引编码(kmeans集群与k = 10) 软件使用k——集群分配每个观察之一10集群。每一行在生成的特性是集群指数相应的观察。由此产生的特性是一个分类变量。
    q50(变量) 等概率的装箱(箱子的数量= 50) 该软件将变量值到50等概率的垃圾箱。由此产生的特性是一个分类变量。
    woe5(变量) 重量的证据(积极类= Class5)

    软件执行以下步骤,以创建最终的特点:

    • 计算有多少总观察Class5作为一个响应(一个),有多少不同的响应(b)。

    • 每个类别的变量类别,确定有多少的观察Class5作为一个响应(c),有多少不同的响应(d)。

    • 对于每一个类别,计算重量的证据(悲哀)

      ln ( ( c + 0.5 ) / 一个 ( d + 0.5 ) / b )

    • 每个分类值替换为相应的悲哀,创建一个数值变量。

    介绍了R2021a