1. Learn
  2. /
  3. Cursuri
  4. /
  5. Exersează întrebări de interviu pentru Machine Learning în Python

Connected

exercițiu

Vizualizarea componentelor principale cu un scree plot

Într-un interviu de machine learning, s-ar putea să ți se ceară să determini numărul optim de caracteristici de păstrat. În acest exercițiu vei crea un scree plot și un grafic al varianței explicate cumulative pentru componentele principale, folosind PCA pe loan_data. Acest lucru te va ajuta să identifici numărul optim de componente principale pentru antrenarea unui model ML mai precis.

Deoarece PCA este o metodă de învățare nesupervizată, analiza componentelor principale se efectuează pe matricea X din care a fost eliminată variabila țintă Loan Status. Dacă nu setezi n_components, modelul antrenat va returna toate componentele principale.

Instrucțiuni 1/4

undefined XP
  • 1
    • Creează matricea de date X eliminând variabila țintă.
    • Instanțiază, antrenează și transformă un obiect PCA care returnează 10 componente principale.
  • 2
    • Creează un DataFrame care mapează Variance Explained la rata varianței explicate.
    • Creează un scree plot din pca_df, plasând componentele principale pe axa x și varianța explicată pe axa y.
  • 3
    • Instanțiază, antrenează și transformă un obiect PCA fără a seta n_components.
    • Afișează rata varianței explicate.
  • 4
    • Atribuie suma cumulativă a ratelor explicate din pasul anterior variabilei cumulative_var.
    • Trasează graficul rezultatelor.