重み付き非线形回帰
この例,非定数分散あるデータ非线形モデルを近似するする方法をを。。。
測定誤差の分散がすべて同じである場合、通常の非線形最小二乗アルゴリズムが適しています。この前提条件が当てはまらない場合は、重み付き近似が適しています。この例では、関数fitnlm
で重み付け使用するを示します。
近似のためのデータとモデル
収集したデータを使用して、産業廃棄物と家庭廃棄物に起因する水質汚染について研究します。これらのデータは、Box, G.P., W.G. Hunter, and J.S. Hunter, Statistics for Experimenters (Wiley, 1978, pp. 483-487) で詳しく説明されています。応答変数は、生化学的酸素要求量 (mg/l) で、予想変数は培養時間 (日数) です。
x = [1 2 3 5 7 10]';y = [109 149 149 191 213 224]';情节(x,y,'ko')xlabel('Incubation (days), x')ylabel('生化氧需求(mg/l),y')
2回回観测残り残り観测よりも精度精度行わでことことががわかっわかっわかっててているいる仮定仮定ししますます。。たとえばたとえばたとえば,异なる异なる器具器具をををを使用理由,れた各観测値値値値値値値値値値値値使用しししてててて行っ行っ行っ行っ行った复数复数のの测定测定ののの平均平均平均平均であるであるであるであるためためですですです。。。ここ4つののののののつのつのがががが回回生値値ののの平均であるであるであるととます。。するとと,各観测使用使用ししし
w = [1 1 5 5 5 5]';
重みをしないの当てはめ
これら,,,,,,,大きくととにに平坦になるスケーリングされたた指数指数です
modelfun = @(b,x)b(1)。*(1-exp(-b(2)。*x));
240付近は曲线さ点,ととと,点点点を経由経由曲线曲线曲线曲线曲线曲线曲线はははははははははははははははははははははははははははははははははははははははははははははは(x = 15 = 15付近)で付近付近付近曲线曲线曲线点^( - 。5*15)は1に1に小さい,,,,ををををの値使用。。。。
开始= [240;.5];
測定誤差を無視すると,近似が不正確な測定の影響を過度に受けてしまう危険性があり,さらにこれが原因で既知の正確な測定への近似ができなくなる可能性があります。重みを使用せずにデータを近似し、各点と比較してみましょう。
nlm = fitnlm(x,y,modelFun,start); xx = linspace(0,12)'; line(xx,predict(nlm,xx),'linestyle',,,,' - ',,,,'颜色',,,,'K')
2点のの点に引き寄せてますが他の点点トレンドトレンドにには従っ従っないない
重みをしたの当てはめ
重みをし近似をてみましょう。
wnlm = fitnlm(x,y,modelfun,start,'重量',,,,w)
wnlm = Nonlinear regression model: y ~ b1*(1 - exp( - b2*x)) Estimated Coefficients: Estimate SE tStat pValue ________ ________ ______ __________ b1 225.17 10.7 21.045 3.0134e-05 b2 0.40078 0.064296 6.2333 0.0033745 Number of observations: 6,误差自由度:4根平方误差:24 R平方:0.908,调整后的R平方0.885 F统计与零模型:696,p-value = 8.2e-06
线(xx,预测(wnlm,xx),'颜色',,,,'b')
この場合、推定母標準偏差は、重みまたは測定精度 1 の "標準" 観測値の平均誤差を示します。
wnlm.rmse
ANS = 24.0096
どのなも,モデル近似の精度推定はなですです。系数系数表示表示表示ににはパラメーターパラメーターのの标准误差误差が表示ささますますがが
COEFCI(wnlm)
ans =2×2195.4650 254.8788 0.2223 0.5793
応答曲线の推定
に,た値値,それに対する区间区间をますます。。既定既定ででではは,,幅幅はは予测予测値値の点点単位単位のののの信頼信頼信頼信頼ですですががががが
[ypred,ypredci] =预测(wnlm,xx,'同时',真的);情节(x,y,'ko',xx,ypred,'b-',,,,xx,ypredci,'R:')xlabel('X')ylabel('y')ylim([-150 350]) legend({'Data',,,,'Weighted fit',,,,'95%的信心限制'},,...'地点',,,,'东南')
2 2つのた减らし减らし减らしつのつのつの残り点ほど近似近似さされれないないないことことに注意しててくださいください。,,重み付き近似近似近似に
指定x値でのの予测区间ををこともますます。。これらこれらののの区间区间区间でででは,,重みみみみみみみみみみみみみみみみみ
[ypred,ypredci] =预测(wnlm,xx,'同时',真的,...'Prediction',,,,“观察”);情节(x,y,'ko',xx,ypred,'b-',,,,xx,ypredci,'R:')xlabel('X')ylabel('y')ylim([-150 350]) legend({'Data',,,,'Weighted fit',,,,'95%的预测限制'},,...'地点',,,,'东南')
重み绝対,パラメーターのには影响しませんををどのどのどの定数定数ででで再再再スケーリングててもも,,,,推定推定结果结果ははは同じ同じですですです。。。。。ただし,信頼信頼ににに値をがているためですここは信頼限界と比较比较するするとと重みが大きい点はは,,近似近似近似直线直线
ここでこのの最后最后のののとに,,,つのつの测定値の平均にに基づく新しい新しい観测行い行いpredict
の名前と値の引数权重
を使用して観測値の重みを指定します。
[new_ypred,new_ypredci] =预测(wnlm,xx,'同时',真的,...'Prediction',,,,“观察”,,,,“重量”,5*一个(size(xx)));情节(x,y,'ko',xx,new_ypred,'b-',xx,new_ypredci,'R:')xlabel('X')ylabel('y')ylim([-150 350]) legend({'Data',,,,'Weighted fit',,,,'95%的预测限制'},,...'地点',,,,'东南')
关数predict
は、観測値一世
における误差分散をMSE*(1/W(i))
により推定し。MSE
は平均误差したがって,信頼が狭くなります。
残差分析
データ近似に加え,予测子近似からの残差もプロット,モデルモデルのの问题问题问题をを诊断しします。。残差残差はは独立同同一分布分布ででで表示れれれれされをプロットして値値同じ分散をを同一一分布分布ににになるなること确认确认ししますます。。标准化さされたた残差は,生生残差
r = wnlm.residuals.standard;情节(x,r,'b^')xlabel('X')ylabel(“标准残差”)
このプロット,系统的ながパターンれれ。。。最后最后最后つのつのつの残差にに线形线形线形のトレンドトレンドがあることことにに注意注意注意てくださいください。。,しを,,,,,,,,,ががが残差残差ののの大き大き大きさささ减少がががががががががががががががににににに依存依存依存性性性示し示し示し示し示し示し示し点がため,明らかなパターン意味持たせることは困难です。