1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶMachine Learning面接対策

Connected

Exercise

多重共線性への対処法 - PCA

前の演習では、diabetes データセットで最も高い相関を示した独立変数 s1 と s2 を、特徴量エンジニアリングで s1_s2 に結合しました。

この演習では、Linear Regression を適用する前に、diabetes に対して PCA を実行して多重共線性を取り除きます。次に、その出力指標を前の演習の結果と比較します。最後に、PCA により多重共線性が完全に除去されることを踏まえ、データセットの相関行列とヒートマップがどのように見えるかを可視化します。

Instrukcje 1 / 3

undefined XP
  • 1
    • PCA を実行するために必要なモジュールをインポートします。
    • インスタンス化して学習(fit)します。
    • 学習用とテスト用をそれぞれ個別に変換(transform)します。
  • 2
    • PCA で変換したデータセットに対して Linear Regression をインスタンス化・学習・予測します。
    • モデル係数、MSE、決定係数(r-squared)を出力します。
  • 3
    • 相関行列を作成し、ヒートマップとして可視化します。
    • 独立変数間の関係を確認するため、行列を出力します。