数据可能需要预处理技术,以确保准确、高效或有意义的分析。数据清理是指寻找、删除和替换坏的或丢失的数据的方法。检测局部极值和突变可以帮助识别重要的数据趋势。平滑和去趋势是去除数据中的噪声和多项式趋势的过程,而缩放改变数据的边界。分组和分类方法按组识别数据特征。
这个示例展示了如何查找、清理和删除缺少数据的表行。
从数据中去除线性趋势。
可以使用分组变量对数据变量进行分类。
这个示例展示了如何对数据进行分组,并将统计函数应用于每个组。
这个示例展示了如何对数据变量进行分组,并将函数应用到每一组。