1. Nauka
  2. /
  3. Kursy
  4. /
  5. Braki danych w Pythonie

Connected

ćwiczenie

Kodowanie porządkowe kolumny kategorycznej

Imputacja wartości kategorycznych wymaga kilku dodatkowych kroków w porównaniu z imputacją wartości liczbowych. Najpierw trzeba je przekonwertować na wartości numeryczne, ponieważ na łańcuchach znakowych nie można wykonywać operacji statystycznych.

Skorzystasz ze zbioru danych profilów użytkowników, który zawiera preferencje i wybory klientów restauracji. Zbiór zawiera wyłącznie cechy kategoryczne. W tym ćwiczeniu przekonwertujesz kolumnę kategoryczną 'ambience' na kolumnę numeryczną, używając OrdinalEncoder z biblioteki sklearn. Ramka danych została załadowana jako users. Funkcja OrdinalEncoder() jest również dostępna.

Wyniki head() i tail() ramki danych users zostały wyświetlone.

Instrukcje

100 XP
  • Utwórz obiekt kodera porządkowego i przypisz go do zmiennej ambience_ord_enc.
  • Wybierz wartości bez braków z kolumny 'ambience' w ramce users.
  • Zmień kształt zmiennej ambience_not_null na (-1, 1).
  • Zastąp wartości bez braków w kolumnie ambience ich zakodowanymi odpowiednikami.