1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Preprocessing pro Machine Learning v Pythonu

Connected

Cvičení

Kódování kategorických proměnných

Několik sloupců v datasetu UFO je potřeba zakódovat, než je bude možné použít ve scikit-learn. Tady provedeš tuto transformaci pomocí binárního kódování i kódování one-hot.

Pokyny

100 XP
  • Pomocí apply() napiš podmíněnou funkci lambda, která vrátí 1, pokud je hodnota "us", jinak vrátí 0.
  • Vypiš počet .unique() hodnot ve sloupci type.
  • Pomocí pd.get_dummies() vytvoř one-hot zakódovanou sadu pro sloupec type.
  • Nakonec pomocí pd.concat() připoj zakódované proměnné type_set k datasetu ufo.