1. Uczyć się
  2. /
  3. Courses
  4. /
  5. Preprocessing w uczeniu maszynowym w Pythonie

Connected

Exercise

Kodowanie zmiennych kategorycznych

W zbiorze danych o obserwacjach UFO jest kilka kolumn, które przed modelowaniem za pomocą scikit-learn wymagają zakodowania. Wykonasz to przekształcenie tutaj, korzystając zarówno z kodowania binarnego, jak i one-hot encoding.

Instrukcje

100 XP
  • Za pomocą apply() napisz warunkową funkcję lambda, która zwraca 1, jeśli wartość wynosi "us", a w przeciwnym razie zwraca 0.
  • Wyświetl liczbę unikalnych wartości (.unique()) w kolumnie type.
  • Za pomocą pd.get_dummies() utwórz zakodowany metodą one-hot zbiór dla kolumny type.
  • Na koniec użyj pd.concat(), aby połączyć zakodowane zmienne type_set ze zbiorem danych ufo.