数据可能需要预处理技术,以确保准确、高效或有意义的分析。数据清理是指寻找、删除和替换坏数据或丢失数据的方法。检测局部极值和突变可以帮助识别重要的数据趋势。平滑和去趋势是去除噪声和多项式趋势的过程,而缩放改变了数据的边界。分组和装箱方法通过分组来识别数据特征。
这个示例展示了如何查找、清除和删除缺少数据的表行。
从数据中删除线性趋势。
可以使用分组变量对数据变量进行分类。
这个例子展示了如何对数据进行分组并对每个分组应用统计函数。
这个例子展示了如何对数据变量进行分组并对每个分组应用函数。