忘れた時に振り返ることができるように最小二乗法によるパラメータ推定についてまとめた。
問題設定
このデータ点が得られたとき、このデータ点をという関係式で表したい(すなわちの値を推定したい)。これを行列表記すると
となり、が最小となるようなパラメータを求めたい。
パラメータ導出
を最小にするは
別の書き方をしてみると
途中で数学公式まとめの「ベクトルでの微分」を参考にしている。転置をとると
と求まる。これをnormal equationと呼ぶ。
reduced QR分解を使った解法
QR分解については数学公式まとめを参照。
行列をとreduced QR分解(は行列、は行列)できたとする。この場合、normal equationは
は単位行列になる(ただしは正方行列ではないので直交行列とは呼ばない)。したがって
Rは正方行列であり、がフルランク行列()であることは前提なので逆行列が存在する。両辺に左からをかけると
数学公式まとめより、なので、
このことは、最小二乗法の解はnormal equationではなくの方程式をQR分解で解けば良いことを示している。
参考
ロバスト推定
上記の最小二乗法では誤差の重みを全て同等に扱っているが、これだと回帰値から大きく外れた点がに与える寄与が大きくなりアウトライヤー点の影響を受けやすくなる。そこで、そのような点の寄与を小さくするために重みを下げる方法がある。各誤差の寄与を誤差の絶対値の関数として決めることにすると
ここで、通常の最小二乗法ではであることに注意せよ。
これを微分していくと
この表式から、を各誤差に対する重みと考えることができる。
具体例として、Huber関数を考える。Huber関数とは、誤差関数がある正の定数を用いて
と定義される関数である。この重みは
となる。
参考
https://socialsciences.mcmaster.ca/jfox/Books/Companion-2E/appendix/Appendix-Robust-Regression.pdf