1. Nauka
  2. /
  3. Kursy
  4. /
  5. Projektowanie przepływów pracy uczenia maszynowego w Pythonie

Connected

ćwiczenie

Kodowanie zmiennych kategorycznych

Twój kolega przekształcił kolumny w zbiorze danych o kredytach na wartości numeryczne za pomocą LabelEncoder(). Pominął jedną: credit_history, która zawiera historię kredytową wnioskodawcy. Chcesz stworzyć dwie wersje zbioru danych – jedną z użyciem LabelEncoder(), a drugą z kodowaniem one-hot – w celu porównania. Macierz cech jest dostępna jako credit. Masz załadowany LabelEncoder() oraz bibliotekę pandas jako pd.

Instrukcje

100 XP
  • Zakoduj credit_history za pomocą LabelEncoder().
  • Połącz wynik z oryginalną ramką danych.
  • Utwórz nową ramkę danych, łącząc kolumny kodowania one-hot z oryginalną ramką.
  • Sprawdź, czy kodowanie one-hot daje więcej kolumn niż kodowanie etykietowe.