数据预处理

数据清理,平滑,分组

数据可能需要预处理技术来确保准确、有效或有意义的分析。数据清理是指寻找、删除和替换坏数据或丢失数据的方法。检测局部极值和突变可以帮助识别重要的数据趋势。平滑和去趋势是从数据中去除噪声和多项式趋势的过程,而缩放会改变数据的边界。分组和分页方法按组标识数据特征。

住编辑任务

清洁缺失的数据 在活动编辑器中查找、填充或删除丢失的数据
干净的异常数据 在实时编辑器中查找、填充或删除异常值
找到变化点 在实时编辑器中查找数据中的突然变化
寻找局部极值 在实时编辑器中找到本地的最大值和最小值
平稳的数据 在实时编辑器中平滑有噪声的数据
删除趋势 在实时编辑器中从数据中删除多项式趋势
连接表 在活动编辑器中使用关键变量组合两个表

功能

全部展开

ismissing 找到失踪的值
rmmissing 删除丢失的条目
fillmissing 填补缺失值
失踪 创建缺失的值
standardizeMissing 插入标准缺失值
isoutlier 查找数据异常
filloutliers 检测并替换数据中的异常值
rmoutliers 检测和删除数据中的异常值
movmad 移动中值绝对偏差
ischange 发现数据中的突变
islocalmin 发现局部最小值
islocalmax 找到当地的最大值
smoothdata 平滑噪声数据
movmean 移动的意思
movmedian 移动平均
去趋势 消除多项式趋势
正常化 规范化的数据
重新调节 数组元素的缩放范围
离散化 将数据分组到箱子或类别中
groupcounts 组元素的数量
groupfilter 过滤器由集团
groupsummary 集团汇总计算
grouptransform 按组变换
histcounts 直方图箱数
histcounts2 二元直方图bin计数
findgroups 查找组并返回组号
splitapply 将数据分组并应用函数
rowfun 将函数应用于表或时间表行
varfun 将函数应用于表或时间表变量
accumarray 累积构造数组

主题

干净的混乱和缺失数据表

这个示例展示了如何查找、清理和删除缺少数据的表行。

消除趋势数据

从数据中删除线性趋势。

将变量分组以拆分数据

可以使用分组变量对数据变量进行分类。

将数据分组并计算统计数据

这个示例展示了如何对数据进行分组并将统计函数应用于每个组。

拆分表格数据变量和应用功能

这个示例展示了如何对数据变量进行分组并将函数应用于每个组。

特色的例子