主要内容

このページの翻訳は最新ではありません。ここをクリックして,英語の最新版を参照してください。

addTerms

線形回帰モデルに項を追加

説明

NewMdl= addterms(MDL.条款は,MDL.の入力データおよび設定を使用し,条款の項を追加して,あてはめた線形回帰モデルを返します。

すべて折りたたむ

交互作用がないCarsmall.データセットの線形回帰モデルを作成してから,交互作用項を追加します。

Carsmall.データセットを読み込み,重量およびモデル年の关数としてMPGのモデルを作成します。

负载Carsmall.台=表(MPG、重量);资源描述。年=分类(Model_Year);mdl = fitlm(资源描述,'MPG ~年+重量^2'
mdl =线性回归模型:MPG ~ 1 +权重+年+权重^2Estimate SE tStat pValue __________ __________ _______ __________ (Intercept) 54.206 4.7117 11.505 2.6648e-19 Weight -0.016404 0.0031249 -5.2493 1.0283e-06 Year_76 2.0887 0.71491 2.9215 0.0044137 Year_82 8.1864 0.81531 10.041 2.6364e-16 Weight^2 1.5573 -06 4.9454e-07 3.149 0.0022303观测数:94、误差自由度:89均方根误差:2.78 r平方:0.885,校正r平方:0.88 f统计量与常数模型:172,p-value = 5.52 -41

このモデルには,截距重量年度_76年份体重^ 2という5つの項が含まれています。年度_76年份は3つの異なる値をもつカテゴリカル変数一年の指標変数です。

変数一年と変数重量の間の交互作用項をMDL.に追加します。

条款=“年*重量”;NewMdl = addTerms (mdl条款)
NEWMDL =线性回归模型:MPG〜1 +重量*一年+重量^ 2估计系数:估计系数___________ ________________________________39670-10重量-0.012624 0.00455 -39624 0.00455 -39624年度_82 16.416 4.9802 3.2962 0.0014196重量:年度_76 -0.00020693 0.00092403 -0.22394 0.82394重量:年份_82-0.0032574 0.0018919 -1.7217 0.018919 -1.7217 0.018919 -1.7217 0.018673重量^ 2 1.0121E-06 6.12E-07 1.6538 0.10177观察数:94,误差自由度:87根均值平方误差:2.76 R线:0.89,调整R线:0.882 F统计与常数型号:117,P值= 1.88E-39

NewMdlには,重量* Year_76および重量* Year_82という2つの項が追加されています。

入力引数

すべて折りたたむ

線形回帰モデル。fitlmまたはstepwiselmをを用して作物LinearModelオブジェクトとして指定します。

回帰モデルMDL.に追加する項。次のいずれかを指定します。

  • 1つ以上の項を表す,ウィルキンソンの表記法による文字ベクトルまたは字符串スカラー式。式の変数名は,有効なMATLAB®識別子でなければなりません。

  • T行P列の项行列T。tは項の個数,pはMDL.内の予測子変数の個数です。T (i, j)の値は項の変数jの指数です。

    たとえば,一个BおよびCという3つの変数がこの順序でMDL.に含まれているとします。Tの各行は1つの項を表します。

    • [0 0 0]——定数項(切片)

    • (0 1 0)- - - - - -BA^0 * b ^1 * c ^0と等価)

    • [1 0 1]- - - - - -* C

    • (2 0 0)- - - - - -^ 2

    • [0 1 2]- - - - - -B * (C ^ 2)

addTermsは,カテゴリカル予測子の指標変数のグループを単一の変数として扱います。したがって,モデルに追加する指標変数を指定することはできません。モデルに追加するカテゴリカル予測子が指定された場合,addTermsは予測子の指標変数のグループを一度に追加します。指標変数を手動で作成してそれぞれを独立した変数として扱う方法を説明した例については,一步の使用による線形回帰モデルの修正を参照してください。

出力引数

すべて折りたたむ

項が追加された線形回帰モデル。LinearModelオブジェクトとして返されます。NewMdlは,MDL.の入力データと設定を使用し,条款で指定された项を追加して新しくあてはめたモデルです。

入力引数MDL.を上書きするには,新しくあてはめたモデルをMDL.に代入します。

mdl = addTerms (mdl、条款);

詳細

すべて折りたたむ

ウィルキンソンの表記法

ウィルキンソンの表记法,モデルに现处于するするを记述ます。

ウィルキンソンの表記法では,以下の記号を使用します。

  • +は,次の変数を含むことを意味します。

  • - - - - - -は,次の変数を含まないことを意味します。

  • は,項の積である交互作用を定義します。

  • は,交互作用と,より低い次数の项すべてを定义します。

  • は,を繰り返した場合とまったく同じ方法で予測子をべき乗にします。このため,には,より低い次数の項も含まれます。

  • ()は,項をグループ化します。

次の表に,ウィルキンソンの表記法の代表的な例を示します。

ウィルキンソンの表記法 标准表记の项
1 定数 (切片) 項
x1 ^ kkは正の整数 x1x12、……x1k
x1 + x2 x1x2
x1 * x2 x1x2x1 * x2
X1:X2 x1 * x2のみ
x2 x2は含めない
x1 * x2 + x3 x1x2x3x1 * x2
X1 + x2 + x3 + X1:x2 x1x2x3x1 * x2
x1 * x2 * x3 - x1, x2, x3 x1x2x3x1 * x2x1 * x3x2 * x3
x1 * (x2 + x3) x1x2x3x1 * x2x1 * x3

詳細は,ウィルキンソンの表記法を参照してください。

アルゴリズム

  • addTermsでは,カテゴリカル予测子が次のように扱われます。

    • L個のレベル(カテゴリ)があるカテゴリカル予測子をもつモデルには,L - 1個の指標変数が含まれています。1番目のカテゴリが基準レベルとして使用されるので、基準レベルに対する指標変数はモデルに含まれません。カテゴリカル予測子のデータ型が分类である場合,类别を使用してカテゴリの顺序をチェックし,reordercatsを使用してカテゴリを並べ替えることにより,基準レベルをカスタマイズできます。指標変数の作成の詳細については,ダミー変数の自動作成を参照してください。

    • addTermsは,L - 1個の指標変数のグループを単一の変数として扱います。指標変数を個別の予測子変数として扱うには,dummyvarを使用して指标変数を手动で作成します。そして,モデルをあてはめるときに,カテゴリカル変数の基准レベルに対応するものを除く指标変数を使用します。カテゴリカル予测子Xについてdummyvar(x)のすべての列と切片項を予測子として指定した場合,計画行列はランク落ちとなります。

    • L個のレベルをもつカテゴリカル予測子と連続予測子の間の交互作用項は,L - 1个の指标変数と连続予测子の要素単位の积から构成されます。

    • L個のレベルをもつカテゴリカル予測子とM個のレベルをもつカテゴリカル予測子の間の交互作用項は,2つのカテゴリカル予測子のレベルについて可能なすべての組み合わせを含めるため,(l - 1)*(m - 1)个个指标指标数からから成されます。

    • 指標の二乗はそれ自体に等しいので,より次数が高い項をカテゴリカル予測子に対して指定することはできません。

代替機能

  • stepwiselmを使用して開始モデルの項を指定し,項の追加や削除が有益ではなくなるまでモデルの改善を続けます。

  • 特定の項をモデルから削除するには,removeTermsを使用します。

  • 項の追加または削除によってモデルを最適に改善するには,一步を使用します。

拡張機能

R2012aで導入