主要内容

このページの翻訳は最新ではありません。ここをクリックして、英語の最新版を参照してください。

データの前処理

データ クリーニング、平滑化、グループ化

正確な、効率的な、または有意義な解析を確実に行うために、データに前処理の手法が必要になる場合があります。データ クリーニングは、正しくないデータや欠落したデータを検索、削除、および置換する方法を指します。局所的極値や急激な変化を検出すると、重要なデータのトレンドを識別できます。平滑化およびトレンド除去は、スケーリングによってデータの境界を変更しながら、ノイズや多項式トレンドをデータから削除する処理です。グループ化とビン化の方法によって、データの特性をグループごとに特定します。

ライブ エディター タスク

欠損データの削除 ライブ エディターでの欠損データの検出、埋め込みまたは削除
外れ値データの削除 ライブ エディターでの外れ値の検出、埋め込みまたは削除
変化点の検出 ライブ エディターでデータ内の急激な変化を検出
局所的極値の検出 ライブ エディターでの局所的最大値と局所的最小値の検出
データの平滑化 ライブ エディターでノイズを含むデータを平滑化
トレンドの除去 ライブ エディターで多項式トレンドをデータから除去
表の連結 ライブ エディターでキー変数を使用した 2.つの 表の連結

関数

すべて展開する

ismissing公司 欠損値を検出
RMM缺失 欠損エントリを削除
填充缺失 欠損値を埋める
丢失的 欠損値を作成
标准化 標準の欠損値を挿入
异倍 データの外れ値を検出
填充异常值 データの外れ値の検出と置き換え
R外部 データ内の外れ値の検出と削除
莫夫马 移動中央絶対偏差
ischange公司 データの急激な変化の検出
伊斯洛卡明 局所的最小値の検出
islocalmax公司 局所的最大値を検出
平滑数据 ノイズの多いデータの平滑化
移动平均值 移動平均値
动中值 移動中央値
德特伦德 多項式のトレンドを削除
正常化 データの正規化
重缩放 配列要素のスケール範囲
离散化 データをビンまたはカテゴリにグループ化
组计数 グループの要素数
组筛选器 グループによるフィルター処理
组摘要 グループ要約の計算
组变换 グループごとの変換
历史计数 ヒストグラムのビンのカウント数
历史计数2 二変量ヒストグラムのビンのカウント数
查找组 グループを見つけてグループ番号を返す
拆分应用 データをグループに分割して関数を適用
罗文 表または 时间表の行への関数の適用
瓦尔芬 関数をテーブル変数または 时间表変数に適用
accumarray公司 累算による配列作成

トピック

表内の乱雑な欠損データの整理

この例では、データが欠損している 表行を検出、整理および削除する方法を示します。

データのトレンド除去

データの線形トレンドを除去します。

データ分割のためのグループ化変数

グループ化変数を使用して、データ変数を分類できます。

データのグループへの分割と統計値の計算

この例では、データをグループに分割して各グループに統計関数を適用する方法を示します。

テーブル データ変数の分割と関数の適用

この例では、データ変数をグループに分割して各グループに関数を適用する方法を示します。

注目の例