1. 学习
  2. /
  3. 课程
  4. /
  5. Pythonで学ぶMachine Learning面接対策

Connected

练习

スクリープロットで主成分を可視化する

Machine Learning の面接では、保持すべき最適な特徴量の数をどう決めるか尋ねられることがあります。ここでは、loan_data に PCA を適用し、主成分のスクリープロットと累積寄与率のプロットを作成します。 これにより、より高精度な ML モデルを学習するうえで最適な主成分(PCs)の数を判断しやすくなります。

PCA は教師なし手法なので、目的変数 Loan Status をデータセットから除外した X 行列に対して主成分分析を行います。n_components を設定しない場合、学習済みモデルから得られるすべての主成分が返されます。

说明 1 / 共 4 个

undefined XP
  • 1
    • 目的変数を除外してデータ行列 X を作成します。
    • 10 個の主成分を返す PCA オブジェクトを生成し、fit と transform を行います。
  • 2
    • 寄与率に対応する Variance Explained を持つ DataFrame を作成します。
    • pca_df からスクリープロットを作成し、x 軸に PC、y 軸に寄与率を設定します。
  • 3
    • n_components を設定せずに PCA オブジェクトを生成し、fit と transform を行います。
    • 寄与率を出力します。
  • 4
    • 前のステップで得た寄与率の累積和を cumulative_var に代入します。
    • 結果をプロットします。