1. Learn
  2. /
  3. Cursuri
  4. /
  5. Exersează întrebări de interviu pentru Machine Learning în Python

Connected

exercițiu

Vizualizarea separării claselor cu PCA I

O întrebare frecventă la interviurile de machine learning este vizualizarea dimensionalității după aplicarea PCA. În acest exercițiu, vei face exact asta: vei reprezenta grafic primele 2 componente principale ale setului de date loan_data pentru a vizualiza separarea claselor în funcție de statusul împrumutului – achitat integral sau anulat.

Setul de date loan_data a fost scalat și codificat prin one-hot encoding, ceea ce înseamnă că variabilele categorice au fost transformate în indicatori binari, deoarece caracteristicile trebuie să fie pe aceeași scară și să fie numerice înainte de aplicarea PCA.

Un model PCA cu 2 componente principale, împreună cu configurarea unui grafic cu etichete pe axele x și y și un titlu, au fost deja pregătite pentru tine. Vei folosi un DataFrame numit loan_data_PCA în exerciții. Valorile posibile pentru variabila țintă Loan Status sunt 0 și 1. Vei reprezenta PC1 pe axa x și PC2 pe axa y.

Au fost deja importate pentru tine: matplotlib.pyplot ca plt, seaborn ca sns și PCA din sklearn.decomposition.

Instrucțiuni 1/3

undefined XP
    1
    2
    3
  • Atribuie valorile variabilei țintă listei targets.
  • Transmite listele tocmai create funcției zip() în interiorul buclei for.
  • Transmite instanțele în care Loan Status este egal cu target variabilei indicesToKeep.