描述
描述生成的特性
描述
描述(
生成的特性的描述变压器
)变压器
.创建FeatureTransformer
对象变压器
通过使用gencfeatures
或genrfeatures
函数。
例子
分类问题特征的生成与检验
从预测器数据表中生成特征gencfeatures
.方法检查生成的特性描述
对象的功能。
将停电数据作为表读入工作区。删除缺少值的观察值,并显示表的前几行。
中断=可读(“outages.csv”);Tbl = rmmissing(中断);头(台)
地区OutageTime RestorationTime造成损失客户 _____________ ________________ ______ __________ ________________ ___________________ {' 西南的}2002-02-01 12:18 458.98 - 1.8202 e + 06 2002-02-01 16:50{“暴风雪”}{“东南”}2003-02-07)21:15 289.4 - 1.4294 e + 05 2003-02-07 08:14{“暴风雪”}{‘西方’}2004-04-06 05:44 434.81 - 3.4037 e + 05 2004-04-06 06:10{“设备故障”}{“中西部”}2002-03-16 06:18 186.44 - 2.1275 e + 05 2002-03-16 23:23{“暴风”}{‘西方’}2003-06-18 02:4900 2003-06-18 10:54{'攻击'}{'东北'}2003-07-16 16:23 239.93 49434 2003-07-17 01:12{'火灾'}{'中西部'}2004-09-27 11:09 286.72 66104 2004-09-27 16:37{'设备故障'}{'东南'}2004-09-05 17:48 73.387 36073 2004-09-05 20:46{'设备故障'}
一些变量,比如OutageTime
而且RestorationTime
,具有分类器训练函数不支持的数据类型,如金宝appfitcensemble
.
中的预测器生成25个特征资源描述
可以用来训练一群人。指定地区
表变量作为响应。
变压器= gencfeatures(Tbl,“地区”25岁的TargetLearner =“包”)
变压器= FeatureTransformer与属性:类型:'分类' TargetLearner: '包' NumEngineeredFeatures: 22 NumOriginalFeatures: 3 TotalNumFeatures: 25
的变压器
对象包含关于生成的特性和用于创建它们的转换的信息。
为了更好地理解生成的特性,可以使用描述
对象的功能。
Info = describe(变压器)
信息=25×4表类型IsOriginal数据源转换 ___________ __________ ___________________________ _________________________________________________________________________________________________________________ 损失数字真的损失”“客户数字真实客户”“c(原因)直言真正原因”类型的变量分类从一个单元格的数据类型转换”RestorationTime-OutageTime数字虚假OutageTime,RestorationTime" OutageTime与RestorationTime之间的间隔时间,单位为秒" sdn(OutageTime) Numeric false OutageTime "流水号from 01- 2 -2002 12:18:00" woe3(c(Cause)) Numeric false Cause "由单元数据类型分类转换的类型变量-> Weight of Evidence (positive class = SouthEast)" doy(OutageTime) Numeric false OutageTime "年份" kmd1 Numeric false Loss,客户到质心1的欧氏距离(kmeans聚类,k = 10)客户“到质心5的欧式距离(kmeans聚类,k = 10)”quarter(OutageTime)数字错误OutageTime“一年中的季度”woe2(c(Cause))数字错误原因“类型变量分类转换为单元数据类型->证据权重(positive class = NorthEast)”year(RestorationTime)数字错误RestorationTime“年”month(OutageTime)数字错误OutageTime“一年中的月份”损失。*Customers“tods(OutageTime)”“每天的时间(以秒为单位)”
的信息
表中显示:
前三个生成的特性是原创的
资源描述
,尽管软件会转换原始版本导致
变量转换为分类变量c(原因)
.的
OutageTime
而且RestorationTime
变量没有作为生成的特性被包含,因为它们是datetime
变量,不能用于训练袋装集成模型。然而,该软件从这些变量中派生出许多生成的特征,例如第四个特征RestorationTime-OutageTime
.一些生成的特性是多个转换的组合。例如,软件生成第六个特征
woe3 (c(原因)
通过转换导致
变量转换为类别变量,然后计算结果变量的证据权重值。
回归问题的特征生成与检查
从预测器数据表中生成特征genrfeatures
.方法检查生成的特性描述
对象的功能。
将停电数据作为表读入工作区。删除缺少值的观察值,并显示表的前几行。
中断=可读(“outages.csv”);Tbl = rmmissing(中断);头(台)
地区OutageTime RestorationTime造成损失客户 _____________ ________________ ______ __________ ________________ ___________________ {' 西南的}2002-02-01 12:18 458.98 - 1.8202 e + 06 2002-02-01 16:50{“暴风雪”}{“东南”}2003-02-07)21:15 289.4 - 1.4294 e + 05 2003-02-07 08:14{“暴风雪”}{‘西方’}2004-04-06 05:44 434.81 - 3.4037 e + 05 2004-04-06 06:10{“设备故障”}{“中西部”}2002-03-16 06:18 186.44 - 2.1275 e + 05 2002-03-16 23:23{“暴风”}{‘西方’}2003-06-18 02:4900 2003-06-18 10:54{'攻击'}{'东北'}2003-07-16 16:23 239.93 49434 2003-07-17 01:12{'火灾'}{'中西部'}2004-09-27 11:09 286.72 66104 2004-09-27 16:37{'设备故障'}{'东南'}2004-09-05 17:48 73.387 36073 2004-09-05 20:46{'设备故障'}
一些变量,比如OutageTime
而且RestorationTime
,具有回归模型训练函数不支持的数据类型,如金宝appfitrensemble
.
中的预测器生成25个特征资源描述
可以用来训练一群人。指定损失
表变量作为响应。
rng (“默认”)%用于再现性变压器=类型特征(Tbl,“损失”25岁的TargetLearner =“包”)
Transformer = FeatureTransformer与属性:类型:'回归' TargetLearner: '包' NumEngineeredFeatures: 22 NumOriginalFeatures: 3 TotalNumFeatures: 25
的变压器
对象包含关于生成的特性和用于创建它们的转换的信息。
为了更好地理解生成的特性,可以使用描述
对象的功能。
Info = describe(变压器)
信息=25×4表Type IsOriginal InputVariables转换________________________________________________ ___________________________________________________________________ c(Region)分类真区域“从单元格数据类型转换而来的分类类型变量”Customers数值型真客户”“c(Cause)分类真原因”从单元格数据类型转换而来的分类类型变量“kmd2数值型假客户”到质心2的欧式距离(kmeans聚类,k = 10)”kmd1" kmd5数字假客户"到质心5的欧氏距离(kmeans聚类,k = 10)" kmd9数字假客户"到质心9的欧氏距离(kmeans聚类,k = 10)" cos(客户)数字假客户"cos()"“kmi分类错误客户”聚类索引编码(k = 10的kmeans聚类)“kmd7数字错误客户”到质心7的欧氏距离(k = 10的kmeans聚类)“kmd3数字错误客户”到质心3的欧氏距离(k = 10的kmeans聚类)“kmd10数字错误客户”欧氏距离“到质心10的距离(k表示k = 10的聚类)”hour(RestorationTime)数值型的假恢复时间“一天中的小时”\
前三个生成的特性是原创的资源描述
,尽管软件会转换原始版本地区
而且导致
变量分类
变量。
:信息(1:3)%描述(变压器,1:3)
ans =3×4表类型IsOriginal InputVariables转换___________________________________ ______________________________________________________________ c(区域)分类真区域“类型分类转换为单元格数据类型的变量”客户数字真客户“c(原因)分类真原因“类型分类转换为单元格数据类型的变量”
的OutageTime
而且RestorationTime
变量没有作为生成的特性被包含,因为它们是datetime
变量,不能用于训练袋装集成模型。然而,软件从这些变量中衍生出一些生成的特征,例如第10个特征RestorationTime-OutageTime
.
:信息(10日)%描述(变压器、10)
ans =1×4表类型IsOriginal数据源转换 _______ __________ ___________________________ ________________________________________________________________ RestorationTime-OutageTime数字虚假OutageTime RestorationTime“OutageTime之间时间间隔,以秒为单位和RestorationTime”
一些生成的特性是多个转换的组合。例如,软件生成第19个特征fenc (c(原因)
通过转换导致
变量转换为具有10个类别的类别变量,然后计算类别的频率。
:信息(19日)%描述(变压器、19)
ans =1×4表类型IsOriginal数据源转换 _______ __________ ______________ ____________________________________________________________________________________________________________ fenc (c(原因))数字错误原因”类型的变量分类从一个细胞转换数据类型- >频率编码(层数= 10)"
输入参数
变压器
- - - - - -变压器特性
FeatureTransformer
对象
特性转换器,指定为FeatureTransformer
对象。
指数
- - - - - -要描述的特性
数值向量|逻辑向量|字符串数组|字符向量的单元格数组
要描述的特征,指定为表示特征位置的数字或逻辑向量,或表示特征名称的字符向量的字符串数组或单元格数组。
例子:1:12
数据类型:单
|双
|逻辑
|字符串
|细胞
输出参数
算法
功能转换
中一些更复杂的特性转换描述的附加信息信息。转换
.
特性名称示例 | 中样本变换描述信息 |
额外的信息 |
---|---|---|
eb4(变量) |
等宽箱(箱数= 4) |
软件将变量 值到4 等宽的箱子。产生的特征是一个分类变量。 |
fenc(变量) |
频率编码(层数= 10) |
该软件计算的频率10 的类别(或级别)变量 .在生成的特性中,软件用相应的类别频率替换每个类别值,创建一个数值变量。 |
kmc1 |
质心编码(组件#1)(k = 10的kmeans聚类) |
软件使用k-表示聚类将每个观测值分配给其中的一个10 集群。结果特征中的每一行都对应于一个观察值,并且是1 与观测结果相关的星团质心的St分量。生成的特性是一个数值变量。 |
kmd4 |
质心4的欧氏距离(k = 10的kmeans聚类) |
软件使用k-表示聚类将每个观测值分配给其中的一个10 集群。所得到的特征中的每一行都是从对应的观测到的质心的欧几里得距离4 集群。生成的特性是一个数值变量。 |
kmi |
聚类索引编码(k = 10的kmeans聚类) |
软件使用k-表示聚类将每个观测值分配给其中的一个10 集群。结果特征中的每一行都是对应观测的聚类索引。产生的特征是一个分类变量。 |
q50(变量) |
等概率装箱(箱子数= 50) |
软件将变量 值到50 概率相等的箱子。产生的特征是一个分类变量。 |
woe5(变量) |
证据权重(正面等级= Class5) |
此转换仅适用于分类问题。 该软件执行以下步骤来创建结果特性:
|
版本历史
R2021a中引入
Abrir比如
Tiene una versión modificada de este ejemplo。¿Desea abrir este ejemplo con sus modificaciones?
MATLAB突击队
Ha hecho clic en unenlace que对应一个este commando de MATLAB:
弹射突击队introduciéndolo en la ventana de commandos de MATLAB。Los navegadores web no permission comandos de MATLAB。
您也可以从以下列表中选择一个网站:
如何获得最佳的网站性能
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。