1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie maszynowe z PySpark

Connected

ćwiczenie

Kolumny kategoryczne

W zbiorze danych o lotach znajdują się dwie kolumny – carrier i org – które przechowują dane kategoryczne. Musisz przekształcić te kolumny na indeksowane wartości numeryczne.

Instrukcje

100 XP
  • Zaimportuj odpowiednią klasę i utwórz obiekt indeksera, który przekształci kolumnę carrier z łańcucha znaków na indeks numeryczny.
  • Dopasuj obiekt indeksera do danych o lotach.
  • Użyj dopasowanego indeksera, aby utworzyć kolumnę z indeksem numerycznym.
  • Powtórz cały proces dla kolumny org.