主要内容

数据预处理

数据清理、平滑、分组

数据可能需要预处理技术,以确保准确、高效或有意义的分析。数据清理是指寻找、删除和替换坏数据或丢失数据的方法。检测局部极值和突变可以帮助识别重要的数据趋势。平滑和去趋势是去除噪声和多项式趋势的过程,而缩放改变了数据的边界。分组和装箱方法通过分组来识别数据特征。

住编辑任务

清洁缺失的数据 在实时编辑器中查找、填充或删除缺失的数据
干净的异常数据 在实时编辑器中查找、填充或删除异常值
找到变化点 在实时编辑器中发现数据的突然更改
找到当地的极值 在实时编辑器中找到局部最大值和最小值
平滑的数据 在实时编辑器中平滑噪声数据
删除趋势 在实时编辑器中从数据中删除多项式趋势

功能

全部展开

ismissing 找到失踪的值
rmmissing. 删除丢失的条目
fillmissing 填补缺失值
失踪 创建缺失的值
standardizeMissing 插入标准缺失值
isoutlier 查找数据中的异常值
filloutliers 检测并替换数据中的异常值
rmoutliers 检测和删除数据中的异常值
movmad. 移动中位绝对偏差
ischange 发现数据的突然变化
islocalmin 发现局部最小值
islocalmax 找到当地的最大值
smoothdata 平滑噪声数据
movmean 移动的意思
movmedian 移动平均
去趋势 消除多项式趋势
正常化 规范化的数据
重新调节 数组元素的缩放范围
离散化 将数据分组到箱子或类别中
groupcounts 组元素数量
groupfilter 过滤器由集团
groupsummary 组摘要计算
GroupTransform. 由组转换
histcounts 直方图垃圾箱数量
histcounts2 二元直方图bin计数
findgroups 查找组并返回组号
splitapply 将数据拆分为组并应用功能
rowfun 对表或时间表行应用函数
varfun 将函数应用于表或时间表变量
accumarray 积累向量元素

主题

清洁凌乱和缺少表中的数据

这个示例展示了如何查找、清除和删除缺少数据的表行。

消除趋势数据

从数据中删除线性趋势。

分组变量分割数据

可以使用分组变量对数据变量进行分类。

将数据划分为组和计算统计

这个例子展示了如何对数据进行分组并对每个分组应用统计函数。

拆分表数据变量和应用功能

这个例子展示了如何对数据变量进行分组并对每个分组应用函数。

特色的例子