主要内容

数据预处理

数据清理、平滑、分组

数据可能需要预处理技术,以确保准确、高效或有意义的分析。数据清理是指寻找、删除和替换坏的或丢失的数据的方法。检测局部极值和突变可以帮助识别重要的数据趋势。平滑和去趋势是去除数据中的噪声和多项式趋势的过程,而缩放改变数据的边界。分组和分类方法按组识别数据特征。

住编辑任务

清洁缺失的数据 在实时编辑器中查找、填充或删除丢失的数据
干净的异常数据 在实时编辑器中查找、填充或删除异常值
计算由集团 按组总结、转换或筛选
找到变化点 在实时编辑器中查找数据的突然变化
找到当地的极值 在实时编辑器中找到局部最大值和最小值
规范化的数据 在实时编辑器中居中并缩放数据
平滑的数据 在实时编辑器中平滑噪声数据
删除趋势 在实时编辑器中删除多项式趋势数据

功能

全部展开

ismissing 找到失踪的值
rmmissing 删除丢失的条目
fillmissing 填补缺失值
失踪 创建缺失的值
standardizeMissing 插入标准缺失值
isoutlier 找出数据中的异常值
filloutliers 检测和替换数据中的异常值
rmoutliers 检测和去除数据中的异常值
movmad 移动中值绝对偏差
ischange 发现数据的突然变化
islocalmin 发现局部最小值
islocalmax 找到当地的最大值
smoothdata 平滑噪声数据
movmean 移动的意思
movmedian 移动平均
去趋势 消除多项式趋势
trenddecomp 从数据中寻找趋势
正常化 规范化的数据
重新调节 数组元素的缩放范围
离散化 将数据分组到箱子或类别中
groupcounts 群元素数
groupfilter 过滤器由集团
groupsummary 小组总结计算
grouptransform 变换的组
histcounts 直方图箱数
histcounts2 二元直方图bin计数
findgroups 查找组并返回组号
splitapply 将数据分成组并应用功能
rowfun 将函数应用于表或时间表行
varfun 对表或时间表变量应用函数
accumarray 积累向量元素

主题

清理混乱和缺失的数据表

这个示例展示了如何查找、清理和删除缺少数据的表行。

消除趋势数据

从数据中去除线性趋势。

分组变量以分割数据

可以使用分组变量对数据变量进行分类。

数据分组和统计计算

这个示例展示了如何对数据进行分组,并将统计函数应用于每个组。

拆分表数据变量和应用函数

这个示例展示了如何对数据变量进行分组,并将函数应用到每一组。

特色的例子