1. Nauka
  2. /
  3. Kursy
  4. /
  5. Przewidywanie CTR z użyciem uczenia maszynowego w Pythonie

Connected

ćwiczenie

Konwersja zmiennych kategorycznych

Biblioteka sklearn wymaga cech w postaci liczbowej, dlatego ważne jest kodowanie zmiennych kategorycznych na wartości numeryczne. Najpopularniejsza technika – „kodowanie one-hot" – jest prosta w użyciu, lecz bardzo pamięciochłonna. Zamiast niej skorzystasz z techniki haszowania, która przekształca wartości kategoryczne na liczbowe dla każdej kolumny kategorycznej.

Moduł pandas jest dostępny jako pd, a przykładowy obiekt DataFrame jest wczytany jako df.

Instrukcje

100 XP
  • Wybierz kolumny kategoryczne, filtrując po typie danych.
  • Zastosuj funkcję haszującą do każdej z kolumn kategorycznych.