1. Learn
  2. /
  3. Courses
  4. /
  5. Pythonで学ぶMachine Learning面接対策

Connected

Exercise

PCA によるクラス分離の可視化 I

Machine Learning の面接でよく聞かれる質問のひとつに、PCA 後の次元の可視化があります。この演習では、loan_data の最初の2つの主成分をプロットし、ローンの返済状況が「完済」か「貸倒れ」かというクラスが、両主成分上でどのように分離されるかを可視化します。

loan_data データセットは、PCA 前提としてスケーリングとワンホットエンコード済みです。つまり、カテゴリ変数はバイナリ指標に変換され、すべての特徴量が同じスケールかつ数値型になっています。

2 成分の PCA モデルの作成と、x・y ラベルおよびタイトル付きのプロットの準備はすでに行われています。演習では loan_data_PCA という DataFrame を使います。目的変数 Loan Status の取り得る値は 0 と 1 です。x 軸に PC1、y 軸に PC2 をプロットします。

matplotlib.pyplot は plt、seaborn は sns、sklearn.decomposition からの PCA がすでにインポートされています。

Instructions 1/3

undefined XP
    1
    2
    3
  • 目的変数の値をリスト targets に代入します。
  • 直前に作成したリストを、for ループ内の zip() に渡します。
  • Loan Status が target に等しい行のインデックスを indicesToKeep に渡します。