1. Nauka
  2. /
  3. Kursy
  4. /
  5. Preprocessing w uczeniu maszynowym w Pythonie

Connected

ćwiczenie

Wybór istotnych cech

W tym ćwiczeniu zidentyfikujesz zbędne kolumny w zbiorze danych volunteer, a następnie przeprowadzisz selekcję cech, żeby uzyskać DataFrame zawierający tylko te istotne.

Na przykład – jeśli przejrzysz zbiór danych volunteer w konsoli, zobaczysz trzy cechy związane z lokalizacją: locality, region i postalcode. Zawierają pokrewne informacje, więc sensowne jest zachowanie tylko jednej z nich.

Poświęć chwilę na przejrzenie cech zbioru volunteer w konsoli i spróbuj wskazać te, które są zbędne.

Instrukcje

100 XP
  • Utwórz listę nazw zbędnych kolumn i zapisz ją w zmiennej to_drop:
    • Spośród wszystkich cech związanych z lokalizacją zachowaj tylko postalcode.
    • Cechy, które przeszły przez proces inżynierii cech, również są zbędne.
  • Usuń kolumny z listy to_drop ze zbioru danych.
  • Wyświetl .head() zmiennej volunteer_subset, żeby zobaczyć wybrane kolumny.