1. Learn
  2. /
  3. Cursuri
  4. /
  5. Machine Learning cu PySpark

Connected

exercițiu

Coloane categoriale

În setul de date despre zboruri există două coloane, carrier și org, care conțin date categoriale. Trebuie să transformi acele coloane în valori numerice indexate.

Instrucțiuni

100 XP
  • Importă clasa corespunzătoare și creează un obiect indexer pentru a transforma coloana carrier dintr-un șir de caractere într-un index numeric.
  • Pregătește obiectul indexer pe datele despre zboruri.
  • Folosește indexer-ul pregătit pentru a crea coloana cu indexul numeric.
  • Repetă procesul pentru coloana org.