数据可能需要预处理技术,以确保准确、有效或有意义的分析。数据清理是指查找、删除和替换坏的或丢失的数据的方法。检测局部极值和突变有助于识别重要的数据趋势。平滑和去趋势是从数据去除噪音和多项式趋势的过程,而缩放改变数据的边界。分组和装箱方法按组识别数据特征。
这个示例展示了如何查找、清理和删除缺少数据的表行。
从数据中去除线性趋势。
可以使用分组变量对数据变量进行分类。
这个示例展示了如何对数据进行分组,并对每个组应用统计函数。
这个示例展示了如何对数据变量进行分组,并将函数应用到每个分组。