1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Ćwiczenie pytań rekrutacyjnych z uczenia maszynowego w Pythonie

Connected

Exercise

Wizualizacja głównych składowych za pomocą wykresu osypiska

Na rozmowie kwalifikacyjnej z uczenia maszynowego możesz zostać zapytany o optymalną liczbę cech do zachowania. W tym ćwiczeniu utworzysz wykres osypiska (scree plot) oraz wykres skumulowanego stosunku wyjaśnionej wariancji dla głównych składowych, korzystając z PCA na zbiorze loan_data. Pomogą one określić optymalną liczbę głównych składowych (PC) do trenowania dokładniejszego modelu uczenia maszynowego.

Ponieważ PCA jest metodą uczenia nienadzorowanego, analiza głównych składowych jest przeprowadzana na macierzy X – po usunięciu zmiennej docelowej Loan Status ze zbioru danych. Brak ustawienia n_components powoduje, że model zwraca wszystkie główne składowe.

Instrukcje 1/4

undefined XP
  • 1
    • Utwórz macierz danych X, usuwając zmienną docelową.
    • Utwórz obiekt PCA zwracający 10 głównych składowych, a następnie dopasuj go i przekształć dane.
  • 2
    • Utwórz ramkę danych (DataFrame), przypisując stosunek wyjaśnionej wariancji do kolumny Variance Explained.
    • Utwórz wykres osypiska na podstawie pca_df, umieszczając główne składowe na osi x, a wyjaśnioną wariancję na osi y.
  • 3
    • Utwórz obiekt PCA bez ustawiania n_components, a następnie dopasuj go i przekształć dane.
    • Wyświetl stosunek wyjaśnionej wariancji.
  • 4
    • Przypisz skumulowaną sumę stosunków wyjaśnionej wariancji z poprzedniego kroku do zmiennej cumulative_var.
    • Wykreśl wyniki.