主要内容

モデルの作成と評価

特徴選択、特徴量エンジニアリング、モデル選択、ハイパーパラメーターの最適化、交差検証、残差診断、プロット

高品質の回帰モデルを構築するには、正しい特徴量 (予測子) の選択、ハイパーパラメーター (データへの当てはめを行わないモデル パラメーター) の調整、残差診断によるモデル仮定の評価を行うことが重要です。

ハイパーパラメーターの値の選択とモデルの交差検証を繰り返すことにより、ハイパーパラメーターを調整できます。このプロセスでは複数のモデルが生成されますが、推定された汎化誤差が最小になるものが最適なモデルである場合があります。たとえば、SVM モデルを調整するには、一連のボックス制約およびカーネル スケールを選択し、値の各ペアについてモデルを交差検証して、10 分割交差検証の平均二乗誤差の推定値を比較します。

回帰モデルに学習させる前に新しい特徴量を設計するには、genrfeaturesを使用し。

回帰モデルの構築と評価を対話的に行うには、回帰学習器アプリを使用し。

調整されたハイパーパラメーターでモデルを自動的に選択するには、fitrautoを使用し。この関数は、回帰モデルのタイプの選択をさまざまなハイパーパラメーターの値で試し、適切に実行されることが期待される最終モデルを返します。データに最適な回帰モデルのタイプがわからない場合は、fitrautoを使用し。

Statistics and Machine Learning Toolbox™ の一部のノンパラメトリック回帰関数では、ベイズ最適化、グリッド探索またはランダム探索による自動的なハイパーパラメーター調整が提供されます。ベイズ最適化を実装するための main 関数であるbayesoptは,多くのにも応用利き。。はは,ベイズ最適化のワークフローを参照してください。

回帰モデル解釈するため,,酸橙shapleyおよびplotPartialDependenceを使用でき。

アプリ

回帰学習器 教師あり機械学習を使用して、データを予測するように回帰モデルに学習をさせる

関数

すべて展开する

fsrftest F 検定を使用した回帰のための一変量の特徴量ランク付け
fsrmrmr Rank features for regression using minimum redundancy maximum relevance (MRMR) algorithm
FSRNCA 回帰に近傍成分分析を使用する特徴選択
oobPermutedPredictorImportance 回帰木のに対するに対するに対する予测子予测子の予测子の重要度推定推定
partialDependence 部分従属の計算
plotPartialDependence 部分依存(PDP)およびおよび条件期待(冰)プロットプロット作成作成作成
predictorImportance 回帰木の予測子の重要度の推定
predictorImportance 回帰アンサンブルの予測子の重要度の推定
RERIEFF ReliefF または RReliefF アルゴリズムを使用した予測子の重要度のランク付け
顺序F カスタム基准使用した选択选択
Stepwiselm ステップワイズ回帰実行
stepwiseglm ステップワイズによる化线形回帰モデル作成作成
genrfeatures 回帰用自动特徴量エンジニアリング実行実行
describe 生成された特徴量の説明
转换 生成された特徴量を使用した新しいデータの変換
fitrauto 最适さハイパーパラメーターを回帰モデルの自动选択
bayesopt ベイズ最適化を使用した最適な機械学習のハイパーパラメーターの選択
超参数 近似関数を最適化するための変数の説明
optimizableVariable bayesoptまたはその他のオプティマイザーの変数の説明
crossval 交差検証を使用した損失の推定
cvpartition 交差検証用のデータの分割
重新分配 交差検証のための再分割データ
test 交差検証用の検定インデックス
training 交差検证用学习インデックス

Local Interpretable Model-agnostic Explanations (LIME)

酸橙 Local Interpretable Model-agnostic Explanations (LIME)
fit 局部可解释的模型 - 不合骨解释(石灰)のののめめめ
plot 局部可解释的模型不足解释(石灰)ののプロットプロット

シャープレイ値

shapley シャープレイ値
fit クエリ点のシャープレイ値の計算
plot シャープレイ値プロット

部分従属

partialDependence 部分従属の計算
plotPartialDependence 部分依存(PDP)およびおよび条件期待(冰)プロットプロット作成作成作成
coefCI 线形回帰モデルの係数推定値の信頼区間
coefTest 线形回帰モデルの係数に対する線形仮説検定
dwtest 线形回帰オブジェクトによるダービン検定検定
plot 线形回帰モデルの散布図または追加変数プロット
plotAdded 线形回帰モデルの追加変数プロット
PlotAdjustedResponse 线形回帰モデルの調整応答プロット
plotDiagnostics 线形回帰モデルの観測値の診断情報をプロット
plotEffects 线形回帰の子の主效果プロットプロット
plotInteraction 线形回帰モデルの 2 つの予測子の交互作用効果のプロット
情节 线形回帰モデル残差プロット
plotSlice 近似線形回帰面を通るスライスのプロット
coefCI 一般化線形回帰モデルの係数推定の信頼区間
coefTest 一般化线回帰の系数线形仮说検定
devianceTest 一般化线回帰モデル逸脱度の分析
plotDiagnostics 一般化線形回帰モデルの観測値の診断情報のプロット
情节 一般化線形回帰モデルの残差プロット
plotSlice 近似された一般化線形回帰面を通るスライスのプロット
coefCI 非线形回帰モデルの係数推定の信頼区間
coefTest 非线形回帰モデルの係数に対する線形仮説検定
plotDiagnostics 非线形回帰モデルの診断プロット
情节 非线形回帰モデルの残差プロット
plotSlice 近似非线形帰面を通るプロットプロット
linhyptest 線形仮説検定

オブジェクト

すべて展开する

FeatureSelectionNCARegression 近傍成分分析 (NCA) を使用する回帰用の特徴選択
FeatureTransformer 生成された特徴変換
贝叶斯式化 ベイズ最适化结果

トピック

回帰学习器アプリのワークフロー

特徴選択

特徴量エンジニアリング

  • 回帰用の特徴量エンジニアリング
    回帰モデルに学習させる前に新しい特徴量を設計するために、genrfeaturesを使用新しいの予测前に特徴変换新しいデータセットに适用する。

自動モデル選択

ハイパーパラメーターの最適化

モデルの解釈

交差検証

線形モデルの診断

  • 线形回帰のの解釈
    线形回帰出力を表示解釈します。
  • 线形回帰
    线形回帰モデルをあてはめ、結果を調べます。
  • 交互作用の影響による線形回帰
    交互作用ある线形モデルを作成分析,结果を解釈します。
  • 出力と診断統計量の概要
    モデルのプロパティとオブジェクト関数を使用して、あてはめたモデルを評価する。
  • F 統計量と t 統計量
    f f统计统计(ANOVA)手法手法手法使用さ検定统计量统计量ですです。これこれによりにより,モデルまたはまたはモデルののの成分のの有意性性をを検定検定ために役立ち。
  • 決定係数 (R-squared)
    決定係数 (R-squared) は、線形回帰モデルの独立変数 X で説明される応答変数 y の変化に比例する量を表します。
  • 系数の误差と信頼区间
    推定された係数の分散と共分散から、回帰係数の推定値の精度がわかります。
  • 残差
    残差は、y の外れ値を検出し、回帰モデルの誤差項に関する線形回帰仮定を確認する場合に便利です。
  • ダービン・ワトソン検定
    ダービン・ワトソン検定は、時系列データの残差間の自己相関の有無を評価します。
  • クックの距離
    クックの距離は X の値 (予測子変数の観測数) から外れ値を特定する場合に便利です。
  • ハット行列とてこ比
    ハット行列を使用するとてこ比を測定できます。
  • 1 標本を取り除いたときの統計
    1 標本を取り除いたときの共分散の変化 (CovRatio) により、回帰近似に影響を与える観測値が特定されます。

一般化线形モデルの診断

  • 一般化线形モデル
    一般化线形,手法をし,子项応答変数変数との间のの潜在的的な非线形关系关系をを

非線形モデルの診断

  • 非线形回帰
    パラメトリック非線形モデルは、連続応答変数と 1 つ以上の連続予測子変数の関係を表します。