IniziaInizia gratis

Carrier

In questo esercizio creerai uno StringIndexer e un OneHotEncoder per codificare la colonna carrier. Per farlo, chiamerai i costruttori delle classi con gli argomenti inputCol e outputCol.

inputCol è il nome della colonna che vuoi indicizzare o codificare, mentre outputCol è il nome della nuova colonna che il Transformer deve creare.

Questo esercizio fa parte del corso

Fondamenti di PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Crea uno StringIndexer chiamato carr_indexer chiamando StringIndexer() con inputCol="carrier" e outputCol="carrier_index".
  • Crea un OneHotEncoder chiamato carr_encoder chiamando OneHotEncoder() con inputCol="carrier_index" e outputCol="carrier_fact".

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a StringIndexer
carr_indexer = StringIndexer(____)

# Create a OneHotEncoder
carr_encoder = OneHotEncoder(____)
Modifica ed esegui il codice