1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

Bài tập

Wizualizacja separacji klas z PCA I

Częstym pytaniem na rozmowie kwalifikacyjnej z uczenia maszynowego jest wizualizacja wymiarowości po zastosowaniu PCA. W tym ćwiczeniu zrobisz dokładnie to – narysujesz wykres pierwszych 2 składowych głównych zbioru loan_data, aby zobrazować separację klas obu składowych pod kątem statusu kredytu: w pełni spłaconego lub odpisanego.

Zbiór danych loan_data został przeskalowany i zakodowany metodą one-hot, co oznacza, że zmienne kategoryczne zamieniono na wskaźniki binarne – cechy powinny być na tej samej skali i mieć postać numeryczną przed zastosowaniem PCA.

Model PCA z 2 składowymi głównymi oraz wykres z etykietami osi x i y oraz tytułem zostały już przygotowane. W ćwiczeniach będziesz korzystać z obiektu DataFrame o nazwie loan_data_PCA. Możliwe wartości zmiennej docelowej Loan Status to 0 i 1. Na osi x umieścisz PC1, a na osi y – PC2.

Następujące elementy zostały już zaimportowane: matplotlib.pyplot jako plt, seaborn jako sns oraz PCA z sklearn.decomposition.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Przypisz wartości zmiennej docelowej do listy targets.
  • Przekaż właśnie utworzone listy do funkcji zip() wewnątrz pętli for.
  • Przekaż do indicesToKeep instancje, w których Loan Status jest równy target.