部分的最小二乗回帰 (Partial Least Squares Regression, PLS) について、pdfとパワーポイントの資料を作成しました。データセットが与えられたときに、PLSで何ができるか、どのようにPLSを計算するかが説明されています。pdfもスライドも自由にご利用ください。
pdfファイルはこちらから、パワーポイント(pptx)ファイルはこちらからダウンロードできます。
興味のある方はぜひ参考にしていただき、どこかで使いたい方は遠慮なくご利用ください。
ちなみに回帰係数に関してはこちらにまとめています。
部分的最小二乗回帰(Partial Least Squares Regression, PLS)の回帰係数の証明
こちらの↓部分的最小二乗回帰 (Partial Least Squares Regression, PLS) の回帰係数についてです。上の記事を読んでいたりして PLS のことを知っていること前提でお話します。PLS でも、y = Xb の...
PLSの概要
- 線形の回帰分析手法の1つ
- 説明変数(記述子)の数がサンプルの数より多くても計算可能
- 回帰式を作るときにノイズの影響を受けにくい
- 説明変数の間の相関が高くても対応可能
- 主成分分析をしたあとの主成分と目的変数との間で最小二乗法を行うのは主成分回帰 (PCR) であり、PLSとは異なるので注意
- PLS回帰とかPLSRとも呼ばれているが、ここでは PLS
スライドのタイトル
- 部分的最小二乗回帰 (PLS) とは?
- どうして PLS を使うの?~多重共線性~
- 多重共線性への対策
- 主成分回帰 (PCR)
- PCR と PLS との違い
- PLS の概要
- PLSの基本式 (yは1変数)
- 1成分のPLSモデル
- t1の計算 yとの共分散の最大化
- t1の計算 Lagrangeの未定乗数法
- t1の計算 Gの最大化
- t1の計算 式変形
- t1の計算 w1の計算
- p1とq1の計算
- 2成分のPLSモデル
- w2、t2、p2、q2の計算
- 何成分まで用いるか?
- クロスバリデーション
- r2CV (予測的説明分散)
- 成分数の決め方
- Root Mean Squared Error (RMSE) : 誤差の指標
参考資料
- 宮下芳勝・佐々木慎一,コンピュータ・ケミストリー シリーズ3 ケモメトリックス-化学パターン認識と多変量解析-,共立出版 (1995)
- S. Wold, M. Sjöström, L. Eriksson, PLS-regression: a basic tool of chemometrics. Chemometrics and Intelligent Laboratory Systems, 58, 109–130, 2001.
PLSのPythonのプログラムは、こちらの課題10,11,12,14をご参照ください。
以上です。
質問・コメントがありましたら、twitter・facebook・メールなどを通して教えていただけるとうれしいです。